Cepheus, un robot-joueur de poker imbattable et qui peut soigner le diab��te
Si vous pensiez qu'un jeu d'information incompl��te comme le Texas Hold'em ne pourrait jamais ��tre r��solu par un ��tre humain ou une machine, il va falloir revoir votre position.
Selon une ��tude du magazine Science du 09 janvier, un groupe de scientifiques de l'Universit�� d'Alberta a trouv�� le moyen de r��soudre le jeu et a publi�� les r��sultats des recherches qui les ont men��s �� cette conclusion.
Le Fixed Limit Hold'em r��solu par un ordinateur
Ces derni��res ann��es, Michael Bowling, Neil Burch, Michael Johanson et Oskari Tammelin ont travaill�� �� un programme informatique appel�� Cepheus �� un 'bot' dont les concepteurs affirment qu'il ne peut ��tre battu par aucun joueur de poker humain. Jamais.
"Ici, nous annon?ons que le Texas Hold'em �� limite fixe en t��te-��-t��te est quasiment r��solu" affirme l'��tude. Selon les chercheurs, leur syst��me n'offre aucune garantie de "gagner de l'argent �� chaque main, mais de gagner sur le long terme, si l'on prend en compte toutes les mains qui peuvent survenir et que l'on fait la moyenne, alors l'ordinateur ne peut pas perdre �C il est soit �� l'��quilibre soit gagnant".
Dans une interview donn�� au site d��di�� aux nouvelles technologies The Verge, Bowling, ing��nieur informatique et coauteur de l'��tude explique que Cepheus fonctionne en cherchant dans une base de donn��es contenant des situations de jeu pr��d��finies afin de prendre la d��cision optimale dans chaque main.
La base de donn��es a ��t�� construite en laissant l'ordinateur jouer contre lui-m��me, ce qui lui a permis d'apprendre tous les sc��narios possibles auxquels un joueur peut ��tre confront�� �� un moment donn��, explique l'un des coauteurs, Johanson.
"Nous avons eu une phase d'apprentissage o�� le logiciel a commenc�� �� jouer de mani��re al��atoire contre lui-m��me". Selon Johanson, l'ordinateur n'avait "aucune id��e de ce qu'il faisait, si ce n'est de suivre les r��gles du jeu".
Ce processus a permis �� Cepheus d'apprendre tous les moves possibles dans le jeu et de trouver ceux qui m��nent �� la r��ussite, m��me dans un jeu d'information incompl��te comme le poker.
Apprendre de ses erreurs pour avoir un "jeu parfait"
"[Cepheus] pense �� toutes les d��cisions possibles �� chaque moment et �� toutes les actions possibles [�� partir de ce moment]" explique Bowling �� The Verge. Par exemple, le programme peut se demander "Que se passe-t-il si je raise maintenant ? Combien d'argent suppl��mentaire puis-je gagner ou perdre??".
Ainsi, le programme prend en compte toutes les cons��quences possibles de toutes les d��cisions possibles, en calculant les possibilit��s de gagner et les montants d'argent ou de jetons que lu fait gagner ou perdre.
De cette mani��re, si une strat��gie al��atoire co?te de l'argent, Cepheus trouve une strat��gie diff��rente. Cela permet �� Cepheus d'utiliser des strat��gies diff��rentes dans chaque main, d'apprendre de ses erreurs et d'atteindre ce que Bowling appelle "un jeu parfait".
Les scientifiques expliquent que pendant la phase d'apprentissage du robot, ils ont utilis�� un ensemble ''de 200 ordinateurs, chacun ��quip�� de 32 GB de RAM et de 24 processeurs d'unit�� centrale'' pendant 70 jours. D'apr��s Johanson cela a suffit �� faire de leur cr��ation un joueur de poker d��j�� presque parfait.
Des applications dans la sant�� et la s��curit��
"Nous pourrions continuer de l'entra?ner et il continuerait de devenir meilleur" ajoute Bowling �� The Verge. "Mais nous avons cess�� �� ce jour, parce que cela n'apporterait rien d'autre que de le perfectionner encore".
Un autre fait int��ressant montr�� par cette ��tude et que le joueur au bouton a toujours un avantage en jouant en heads-up limit Texas hold'em.
"Nos calculs prouvent de mani��re formelle l'id��e r��pandue selon laquelle le joueur au bouton a un avantage substantiel" affirme l'��tude. Selon Johanson, "Nous pouvons prouver de mani��re factuelle que l'avantage se chiffre �� 88 milliblinds par main ou 0,088 big blind par main".
Au del�� de la menace de voir un jour le poker devenir un jeu impossible �� battre �� cause de robot-joueurs parfaits, les chercheurs pensent que leur ��tude est important pour aider les gouvernements et les entreprises �� mettre en place des syst��mes de s��curit��s "inexploitables".
De plus, cela pourrait aussi aider �� les m��decins �� traiter les patients atteints de diab��te. En suivant un processus similaire �� celui qui lui a permis de d��velopper un ''jeu parfait'', Cepheus peut d��terminer les ''traitements optimaux'' pour un patient dont la situation change �C en prenant en compte tous les facteurs d'incertitudes, exactement comme au poker.
Cepheus, le petit fr��re de Polaris
Si le nom de Bowling ne vous est pas inconnu, c'est qu'il travaill�� �� Polaris, un bot lanc�� en 2007 par l'Universit�� d'Alberta dans le but de prouver qu'une machine pouvait battre un ��tre humain au poker.
A l'��poque, le robot-joueur avait entam�� sa carri��re en se voyant infliger une d��faite par les joueurs professionnels Phil Laak et Ali Eslami dans le cadre du "Premier championnat de poker Homme Machine ".
Un an plus tard, Bowling, encore lui, annon?ait que les d��veloppeurs avait pu cr��er une m��thode d'apprentissage dans laquelle Polaris identifie les strat��gies poker utilis��es par les humains et ��tablit sa propre contre-strat��gie. Polaris, capable d'apprendre de ses erreurs, est ressorti vainqueur du deuxi��me Man-Machine Poker Championship", en s'imposant face �� une ��quipe constitu��e de Nick Grudzien, Kyle Hendon, Rich McRoberts, Victor Acosta, Mark Newhouse, IJay Palansky et Matt Hawrilenko.
Image par The Verge
T��l��chargez PokerStars et cr��ez un nouveau compte avec le code "FRENCHPOKERNEWS" pour pouvoir participer au tournoi gratuit r��serv�� aux joueurs PokerNews avec 1.500� �� gagner chaque mois.
Les derni��res infos du poker sur vos m��dias sociaux : Twitter, Facebook et SoundCloud.