Agenti na bázi umělé inteligence ukazují, že to jde docela jednoduše.
Vědci z japonské Nagoya University zjistili, že kooperativní lov, při němž dva nebo více predátorů spolupracují na ulovení kořisti, nevyžaduje složité kognitivní procesy v mozku. Spolupráce může vzniknout i na základě jednoduchého souboru pravidel a zkušeností. Tato zjištění mají význam nejen pro pochopení evoluce chování zvířat, ale mohou také pomoci při vývoji kooperativních systémů umělé inteligence (autonomní řízení, řízení dopravy apod.).
Předchozí výzkumy spojovaly kooperativní lov se savci, kteří vykazují komplexní sociální chování, jako jsou lvi, vlci nebo šimpanzi. Podobné chování však bylo zjištěno i u druhů s méně rozvinutými kognitivními schopnostmi, např. u krokodýlů nebo i u ryb. To naznačuje, že za tuto formu spolupráce může být zodpovědný jednodušší mechanismus.
Kazushi Tsutsui se spolupracovníky vytvořili výpočetní model, v němž se agenti umělé inteligence učí lovit společně pomocí hlubokého posilovacího učení. Hluboké posilovací učení je proces, při kterém je chování posilováno (kladná zpětná vazba) tím, že je po jeho provedení následuje odměna.
Výzkumníci trénují algoritmy, které se učí prostřednictvím interakce s prostředím a získáváním odměn za konkrétní akce. Pomocí hlubokých neuronových sítí mohou tyto algoritmy zpracovávat vstupy, jako je poloha a rychlost, a činit autonomní rozhodnutí.
Predátoři (respektive je reprezentující agenti s umělou inteligencí, naprogramovaní pomocí učení s posilováním) se naučili spolupracovat při lovu prostřednictvím interakce s prostředím a mechanismem odměny. Začali spolupracovat díky efektivitě takových akcí v očekávání odměny (kořisti), která bude po úspěšném lovu rozdělena mezi skupinu.
Během simulací získávali predátoři s umělou inteligencí odlišné a vzájemně se doplňující role, podobně jako se chovají zvířata, která se zapojují do kooperativního lovu. Jeden agent například kořist pronásledoval, zatímco druhý ji přepadával ze zálohy. S rostoucím počtem predátorů se zvyšovala úspěšnost a snižovala se doba potřebná k lovu.
V závěrečném testu hráli agenti AI roli predátorů a lidští účastníci vystupovali jako kořist. I přes počáteční potíže, jako byl zmatek způsobený nečekanými pohyby lidí, dokázali vycvičení agenti AI spolupracovat a „lidskou kořist“ chytit. To ukazuje (má ukazovat), že úspěšný kooperativní lov nevyžaduje složité kognitivní procesy, a naznačuje, že i predátoři v reálném světě se mohou naučit spolupracovat pomocí jednoduchého souboru pravidel řídících rozhodování. Speciálně autoři studie upozorňují, že pro vznik koordinace/kooperace nebylo potřeba nic jako teorie mysli („když on uvidí, že já…, pak on tedy…“).
Kazushi Tsutsui et al, Collaborative hunting in artificial agents with deep reinforcement learning, eLife (2024). DOI: 10.7554/eLife.85694
Zdroj: Nagoya University / Phys.org
Poznámka PH: Tak tady samozřejmě bude klíčové, co se myslí koordinací. Když se na člověka vrhnou piraně, asi v tom koordinace není, OK. Jenže i pak může mít koordinace různé stupně, dejme tomu, když 2 psi běží za králíkem, nějak se rozmístí (ale není to tak, že by každý z nich měl jinou funkci).