Homme vs. Machine: Les pros du Poker rel��vent le d��fi de l'Intelligence Artificielle

En mai 2015, Claudico, le programme informatique ��labor�� par la Carnegie Melon University, avait virtuellement perdu 732 713$ en 10 jours de poker No Limit contre 4 sp��cialistes de head's up. Doug Polk, Bjorn Li, Dong Kim, Jason Les et l'Intelligence Artificielle avaient mis�� 170 millions de dollars lors de ce d��fi remport�� par l'homme !
8 mois apr��s cette rencontre, la Carnegie Melon University revient �� la charge avec un nouveau programme, Libratus (du latin Puissant et Equilibr��). Lors du dernier d��fi, une cagnotte de 100 000$ avait ��t�� mise en place pour le vainqueur par Microsoft et le Rivers Casino. Cette fois, il y aura 200 000$ en jeu entre l'homme et la machine !
Le duel entre les 4 pros du poker (Jason Les, Dong Kim, Daniel McAulay et Jimmy Chou) Libratus d��butera le 11 janvier �� Pittsburgh, toujours au Rivers Casino. La rencontre s'intitule "Brains Vs. Artificial Intelligence: Upping the Ante", elle consistera en 120 000 mains de head's up �� disputer en 20 jours.
Lors de la derni��re rencontre contre Claudico, 80 000 mains avaient ��t�� disput��es et 3 pros sur 4 avaient termin�� dans le vert. L'Intelligence Artificielle ��tant ��volutive, l'augmentation du nombre de jours de jeu et du nombre de mains doit permettre d'obtenir des r��sultats statistiques plus significatifs.
Les pros seront divis��s en deux groupes et joueront avec un format duplicate (chaque pro du groupe aura les m��mes cartes et l'ordinateur aussi, ndlr) dans une salle diff��rente du casino. La partie aura lieu chaque jour entre 13 heures et 19 heures.
"Depuis les d��buts des recherches dans le domaines de l'IA, battre les meilleurs joueurs humains a toujours ��t�� un outil privil��gi�� de mesure des progr��s", a expliqu�� le cr��ateur de Libratus, le professeur Tuomas Sandholm. "Cela a ��t�� fait dans les ��checs en 1997, avec le Jeopardy! en 2009 ou encore avec le Go l'an dernier. Le poker est un challenge plus difficile car il n��cessite des d��cisions extr��mement complexes car bas��es sur des informations incompl��tes. Il faut aussi int��grer les bluffs et pleins d'autres artifices comme le slow play", a poursuivi le d��veloppeur de Libratus.
Accompagn�� part son ��l��ve Noam Brown, Sandholm a mis en place Libratus en cr��ant un algorithme sp��cifique permettant de d��velopper des strat��gies dans des jeux d'informations incompl��tes. Il a ensuite fait travailler le Bridge supercomputer du Pittsburgh Supercomputing Center pour calculer des millions de sc��narios et des strat��gies potentiellement gagnantes.
Claudico n'avait tourn�� que 2 �� 3 millions d'heures avant d'affronter les humains, Libratus a d��j�� fonctionn�� 15 millions d'heures ! Le limp ��tait une strat��gie tr��s employ��e par Claudico et les pros s'��taient adapt��s pour exploiter cette tendance sans que l'IA ne s'ajuste en retour... Libratus ne devrait pas rester aussi passif et devrait jouer avec une approche bien plus GTO que son pr��d��cesseur. Les scientifiques ont en effet expliqu�� dans un communiqu�� que le robot avait am��lior�� sa strat��gie globale afin d'approcher l'��quilibre de Nash (qui a d'ailleurs ��tudi�� au Carnegie Mellon).
Les recherches dans le domaine de l'IA et de l'ajustement face �� des informations incompl��tes int��ressent largement le domaine des affaires mais aussi du renseignement, de la s��curit��, des op��rations militaires ou encore de la m��decine.
En ce qui concerne le poker Limit en head's up, un groupe de chercheurs de l'Universit�� d'Alberta a r��solu le jeu de mani��re quasi-optimale.