Poker Robots - Polaris 2.0 prend sa revanche contre la Team Stoxpoker

Le logiciel Polaris de l'Universit�� d'Alberta a battu le 6 juillet 2008 sur plusieurs matchs de limit hold'em en t��te �� t��te une ��quipe de joueurs de poker humains �� Las Vegas.
Apr��s sa d��faite en juillet 2007 contre les humains au cours du premier championnat de poker Homme Machine �� Vancouver au Canada, le groupe de recherche en poker informatis�� de l'Universit�� (CPRG) avait une ann��e pour am��liorer ses programmes, appel��s collectivement Polaris, pour une revanche. Leurs efforts ont ��t�� r��compens��s puisque Polaris 2.0 vient de batter l'��quipe de joueurs de poker humains apr��s une s��rie de rencontres de poker limit hold'em.
La comp��tition a pris place au casino Rio �� Las Vegas aux Etats-Unis durant l'expo ? Gaming Life ? en marge des World Series of Poker, avec un match se tenant chaque jour du 3 au 6 juillet 2008. La Team humaine ��tait compos��e de plusieurs membres du site consacr�� �� l'apprentissage du poker Stoxpoker. Contrairement �� l'ann��e derni��re o�� les humains ��taient repr��sent��s par deux joueurs, Phil Laak et Ali Eslami, la team Stoxpoker ��tait d��fendue par notamment Grudzien, Kyle Hendon, Rich McRoberts, Victor Acosta, Mark Newhouse, IJay Palansky et Matt Hawrilenko.
Comme c'��tait le cas l'��t�� dernier, la comp��tition consistait en quatre sessions durant lesquelles les humains jouaient simultan��ment et s��par��ment les m��mes mains de limit holdem ? Duplicate ? contre les programmes avec des blinds $500/$1,000 et des limites $1,000/$2,000. Selon les r��gles du Duplicate poker, les cartes distribu��es aux humains en une session ��taient identiques �� celles distribu��es aux ordinateurs, et vice versa, avec des cartes communes identiques pour chaque main ��galement. Ce format de jeu limite la chance g��n��r��e par le tirage : les humains et les Polaris 2.0 devaient faire face aux m��mes cartes et aux m��mes situations.
A la fin de chaque match, le total de chacune des deux sessions de 500 mains jou��es simultan��ment ��tait mis en commun pour d��terminer le vainqueur de la session. Si le total repr��sentait moins de 25 petites mises d'��cart ($25,000), le match ��tait d��clare nul. Une plus grande diff��rence donnait la victoire �� l'��quipe ayant le total le plus important.
Lors du premier match, ce fut �� Nick Grudzien et Kyle Hendon de rencontrer Polaris 2.0. Hendon finit avec un b��n��fice $37,000 apr��s les 500 mains, Grudzien termina �� moins de $42,000. Comme la diff��rence entre les deux scores ��tant insuffisante, le match fut d��clar�� nul.
Les humains remport��rent le second match, grace aux efforts de Rich McRoberts qui finit �� plus de $89,500 contre l'ordinateur. Son partenaire, Victor Acosta, ne fit pas aussi bien en terminant �� moins $39,500. Le profit des humains de $50,000 leur assurait la victoire.
Polaris 2.0 r��ussit cependant un comeback en remportant �� la fois le troisi��me et le quatri��me match. Lors du troisi��me, Mark Newhouse gagna $251,500, c'est �� dire de loin la plus grosse victoire d'un humain contre un ordinateur. Il reste que son partenaire IJay Palansky termina �� moins $307,500. L'ordinateur conclut donc le match avec un profit de $56,000 pour prendre la victoire. Dans ce match, les cartes avaient clairement avantag�� Newhouse d'un c?t�� et l'ordinateur contre Palansky de l'autre.
La quatri��me session a vu l'ordinateur remporter ses matchs contre les deux humains en finissant avec un profit de $60,500 face �� Mark Hawrilenko et de $29,000 contre Palansky. Ceci donnant �� Polaris 2.0 deux victoires, une d��faite et un nul.
Selon le professeur Michael Bowling, qui dirigeait les ��tudiants de l'Universit�� d'Alberta ayant d��velopp�� le programme Polaris 2.0, des am��liorations significatives avaient ��t�� apport��es depuis l'��t�� dernier et cela rendait les faiblesses du programme plus difficiles �� exploiter par les humains.
Bowling expliqua que les informaticiens avaient ajout�� "un ��l��ment d'apprentissage qui permet �� Polaris d'identifier la strat��gie standard en cours d'un humain et d'ajuster la sienne. ? Autrement dit, l'ordinateur n'emploie plus les m��mes tactiques contre tous les humains. Au contraire, il suit diff��rentes strat��gies contre chaque joueur, ce qui le rend plus difficile �� jouer par les humains devant affronter des strat��gies changeantes durant une session donn��e. La comparaison des prises de note sur le jeu de Polaris 2.0 entre deux ou plusieurs sessions est ��galement difficile �� interpr��ter par les humains.
Polaris 2.0 a ��galement appris de ses propres erreurs en employant un algorithme nomm�� curieusement ? regret contrefactuel ?grace auquel il est capable de garder une trace du jeu des humains durant une main qu'il a perdu pour ensuite ajuster son propre jeu lorsque des circonstances similaires surviennent.
Le CPRG indique vouloir d��velopper ses recherches pour aller au del�� du t��te �� t��te limit hold'em en abordant des jeux plus compliqu��s. Le groupe de recherche veut appliquer le r��sultat de ses recherches en intelligence artificielle aux domaines ext��rieurs au poker.
Qualifiez-vous gratuitement �� partir du 7 juillet pour les tournois EPT de la saison 5 sur PokerStars avec 25$ offerts par PokerNews + 50$ de bonus