Obavy se netýkají jen toho, že zpětnovazebné systémy učení jako AlphaGo se mohou naučit podvádět místo toho, aby zvládaly zadané úkoly. V kapitole 2 jsme popisovali systém odměn založený na dopaminu a jeho funkci v usměrňování chování. Úloha dopaminu byla objevena koncem 50. let dvacátého století, ale ještě před tím, …
více »