L’IA DeepMind s’intéresse au jeu de cartes Hanabi

Écrit par Guillaume

Publié le : {{ dayjs(1549818053*1000).local().format("L").toString()}}

Après avoir annoncé des résultats intéressants sur StarCraft II, DeepMind communique son intérêt pour le jeu de cartes Hanabi, imaginé par un français.

Propriété de Google depuis 2014, la société britannique DeepMind s’est depuis longtemps spécialisée dans le domaine de l’intelligence artificielle. Elle travaille plus particulièrement sur les applications liées aux jeux, de quelque nature que soient ces derniers. Dans un premier temps, Deep Mind a ainsi fait sensation en présentant AlphaGo, un programme capable de jouer au go, généralement considéré comme beaucoup plus complexe que les échecs pour les machines du fait de nombre considérable de combinaisons possibles à chaque tour de jeu. AlphaGo avait d’ailleurs fait très fort en mars 2016 en battant Lee Sedol, l’un des meilleurs joueurs du monde.

Il y a seulement quelques semaines, Deep Mind a présenté ses derniers travaux, toujours dans le domaine du jeu. Cette fois, c’est au jeu vidéo et plus précisément à StarCraft II que l’entreprise s’est attaqué avec, là encore, un certain succès. Si les conditions n’étaient peut-être pas optimales pour les compétiteurs humains, les scores étaient malgré tout sans appel : sur onze parties, l’intelligence artificielle baptisée AlphaStar l’a emporté dix fois. La dernière partie, sans doute la plus équitable puisque l’IA ne pouvait voir qu’une portion de la carte – comme n’importe quel joueur humain – avait toutefois été remportée par MaNa, le joueur humain.

Aujourd’hui, c’est un type de jeux encore différents que Deep Mind cherche à « dompter » et, clin d’œil, c’est un jeu français. La société britannique a effectivement annoncé son intention de travailler sur Hanabi. Imaginé par Antoine Bauza, ce jeu de cartes largement récompensé en 2013, est un titre coopératif où deux à cinq joueurs doivent essayer de constituer des suites de nombres de la même couleur. Ils disposent pour cela de cartes, mais s’ils connaissent les cartes de leurs adversaires, ils ne connaissent pas les leurs qui sont orientées de sorte qu’ils ne puissent en prendre connaissance. À chaque tour, un joueur a trois possibilités : donner un indice à un partenaire, défausser une carte jugée inutile ou jouer une carte en principe « intéressante ».

Toute l’astuce du jeu réside donc dans la nécessaire entraide des joueurs qui doivent communiquer les informations les plus intéressantes à leurs partenaires. Pour une intelligence artificielle, plusieurs défis se posent : alors que dans tous les autres jeux, l’IA disposaient de toutes les informations dont elles avaient besoin, là il faut qu’elle trouve un moyen d’obtenir ces informations, de la manière la plus « rentable » qui soit. En effet, donner un indice coûte un jeton et ces jetons sont en quantité limité. Comme l’expliquent nos confrères du Monde, les chercheurs de DeepMind soulignent qu’« il est impossible de connaître avec certitude toutes ses cartes, [et que] pour dépasser cette limitation, il faut communiquer des informations implicites, via le choix des actions elles-mêmes, que tous les joueurs peuvent observer ». L’IA doit alors être en mesure de comprendre « les convictions et les intentions des autres » afin d’élaborer sa stratégie.

Le jeu Hanabi représente un terrain d’expérimentation extraordinaire pour les intelligences artificielles car, comme le précisent les chercheurs, « Les interactions jouent un rôle primordial dans la vie des humains, il est donc essentiel pour des agents intelligents d’être capables de coopérer efficacement avec d’autres agents, notamment humains ».