Po roce nastává další významný úspěch umělé inteligence. Podobně jako na začátku loňského roku programy triumfovaly nad člověkem v Go, nyní dochází k témuž v případě pokeru.
Turnaj (prozatím) dokládající převahu softwaru probíhá v Pittsburghu, a to ve variantě pokeru Heads-Up, No-Limit Texas Hold’em. V jiných verzích pokeru už software nad člověkem triumfoval, tato se však považovala za zvlášť obtížně zvládnutelnou. 4 pokerové profesionály, jedny z nejlepších hráčů světa a navíc specialisty právě na tuto variantu, zatím drtí program Libratus, vyvinutý na Carnegie Mellon University. Po polovině turnaje je dokázal obrat o téměř půl milionu dolarů (v žetonech; jinak je turnaj dotován cenovým fondem 200 000 dolarů).
Podobně jako v případě Go (a na rozdíl od šachů) je i zde proti lidem úspěšný program univerzálnější, který se podle svých tvůrců zařazuje do kategorie umělé inteligence. Využívá strojové učení, snaží se učit z vlastních chyb, analyzovat strategie protihráčů a přizpůsobovat se jim. Libratus nefunguje „deterministicky“ v tom smyslu, že by se stejnými kartami hrál vždy stejně. Má být zaměřen na zpracování neúplné informace, je schopen blufovat a snaží se i detekovat záměrně falešné signály (blufování ostatních). Proto Libratus by podle svých tvůrců mohl fungovat i při obchodním vyjednávání, plánování vojenských akcí nebo i stanovování diagnózy (také rozhodování na základě neúplných informací). Systém ovšem neběží na žádném běžném PC, ale využívá výkon místního superpočítačového centra. Náročná na zdroje je i fáze, kdy se Libratus učí z posledních her.
Mezi sponzory akce najdeme mj. i Intel.
Libratus vyvinul profesor počítačových věd Tuomas Sandholm a jeho Ph.D. student, Noam Brown.
Zdroj: Carnegie Mellon University
Poznámky PH:
Poker neznám, ale hloupá otázka: neměl by zde existovat program, který statisticky nikdy neprohraje, na základě dostupných informací o kartách prostě vypočítá pravděpodobnosti rozložení karet a úspěchu jednotlivých kroků? (Samozřejmě by nehrál vždy „tahy nejlepší s největší pravděpodobností“, aby se na strategii soupeř nemohl jednoduše adaptovat a de facto tak programu „viděl do ruky“; tah by odpovídal generátoru náhodných čísel kombinovaným s vypočítanými pravděpodobnostmi, program by pak občas i se špatnými kartami zvyšoval sázky apod.)
Mohlo by to, že na poker je potřeba umělá inteligence, přesvědčit legislativu, že poker není hazardní hra, alespoň ne typu rulety?
Video na YouTube