AlphaGo —Quand la machine défie l’homme — 1/3

Maxime Pawlak
7 min readAug 24, 2020

Si vous suivez le monde de l’intelligence artificielle, vous avez déjà entendu parler d’Alpha Go. L’équipe derrière ce projet a fait les gros titres il y a quelques années.

Pendant le confinement, j’en ai profité pour regarder les coulisses de ce projet. Un documentaire a été réalisé et est disponible sur YouTube. Il se regarde comme un film. Je suis moi même resté étonné de l’avoir regardé jusqu’au bout et d’une seule traite. Je ne peux que vous conseiller d’aller le regarder :

Dans cette série de 3 posts, je vais revenir sur l’histoire d’Alpha Go.

Retrouvez les 3 posts via ces liens :

TLDR;

  • En 2016, l’équipe de DeepMind a développé AlphaGo, un programme qui joue au jeu de go ;
  • Le Jeu de go est considéré comme un jeu où l’intuition humaine est indispensable ;
  • AlphaGo a battu différents (tous les) champions mondiaux de Go.

Post 1/3 — Go is the Holy Grail

Dans ce post, nous allons présenter les protagonistes de notre histoire : le jeu de Go et AlphaGo. Nous en profiterons aussi pour présenter les premiers pas d’AlphaGo.

Jeu de go

Le jeu de go est ancré en Asie depuis des siècles. Il est très présent en Chine, en Corée et au Japon. Depuis quelques années, il se développe en Occident. Je ne peux que vous rediriger vers sa page Wikipédia où vous trouverez plein d’informations complémentaires.

Le succès du jeu de Go tient autant à la simplicité de ses règles qu’à sa grande richesse combinatoire et sa profondeur stratégique. Dans le documentaire, une des premières phrases concernant pourquoi les joueurs de Go sont autant passionnés est :

“It’s not just that they want to understand Go. They want to understand what understanding is.”

Le principe est simple. Un tablier de 19 cases sur 19 cases est disposé face aux deux joueurs. Le but est de poser ses jetons les un à côté des autres pour définir un territoire. Une fois qu’une zone est entièrement encerclé, ce territoire devient le votre. Si des jetons adverses sont encerclés, vous les capturez.

Le nombre de configurations possible est supérieur au nombre d’atomes dans l’univers. Aucun ordinateur n’est assez puissant ou n’a assez de mémoire pour calculer toutes les possibilités. Dans la majorité des jeux, les IA fonctionnent ainsi : elles calculent tous les coups possibles et agissent en fonction. Pour le jeu de Go, c’est physiquement impossible (pour le moment).

Les possibilités sont tellement vastes que pendant très longtemps, il était considéré comme impossible de créer un programme capable de battre un professionnel. Au moins jusqu’en 2016…

“L’intuition humaine est indispensable”

DeepMind

DeepMind est une société basée à Londres, spécialisée en Intelligence Artificielle. Elle a été fondée entre autres par Demis Hassabis. Elle est rachetée par Google en 2014.

A leurs début, ils développent une IA sur le jeu Breakout. Vous connaissez sûrement ce jeu de casse-briques.

C’est ce jeu où vous déplacez une barre horizontale de droite à gauche afin de faire rebondir une balle qui doit détruire des briques situées en haut de l’écran.

Breakout

DeepMind a montré à son logiciel des dizaines de vidéos de parties d’autres joueurs. Puis elle a amélioré son programme afin qu’il puisse jouer seul.

Les membres de l’équipe l’ont laissé jouer.

Première partie, le logiciel ne fait rien. Perdu.

Deuxième partie, si je bouge un peu à gauche. Encore perdu.

Tiens les parties où je me mets sous la balle, je ne perds pas aussi vite.

Tiens les parties où les briques disparaissent totalement, je gagne.

Après des centaines et des centaines de parties jouées, le logiciel a appris les règles et maîtrise le jeu.

Après 300 parties, il a compris qu’il fallait rattraper la balle et a le même niveau qu’un joueur moyen.

Après 500 parties, le programme a même découvert une stratégie pour gagner plus rapidement : créer une ouverture pour laisser la balle rebondir entre la plafond et les briques.

Stratégie de Breakout

Le fait que le programme décrouvre seul cette stratégie très astucieuse a surpris les chercheurs eux-mêmes.

AlphaGo

L’équipe de DeepMind se lance ensuite un nouveau défi : développer une intelligence artificelle pour jouer au jeu de go. A l’époque, tout le monde pense qu’il est impossible de développer un programme meilleur qu’un joueur professionnel. C’est comme envoyer une fusée dans l’espace et la faire revenir atterrir sur des barges en pleine mer et la réutiliser. C’est tout simplement impossible voyons !

“Everything we tried with AI, it failed with Go, it’s like the holy Grail”

Dès lors, ils contactent le champion européen : Fan Hui. Ils l’invitent dans leurs bureaux londoniens.

Fan Hui a été champion européen de 2013 à 2015. Pour lui Go, c’est un mirroir. Chaque partie est une véritable introspection :

“I see Go, I also see myself. For me, Go is real life”.

Lorsqu’il reçoit l’invitation de DeepMind, Il est surpris et ne sait pas vraiment à quoi s’attendre. Il a pris cet email pour une blague. Et puis, il y réfléchit et se dit qu’après tout, ce sera une visite à Londres tous frais payés.

“It’s just a program, it will be easy.”

Fan Hui

Le jeu se déroule en 5 parties.

Dès la première partie, Fan Hui sent qu’il a pris son adversaire un peu à la légère. Il ressent bien que les coups joués face à lui n’ont rien de ceux des programmes habituels.

1–0.

AlphaGo gagne la première partie.

2–0

3–0

4–0

5–0.

Jeu, set et match.

On sent Fan Hui stressé, mal à l’aise. Il n’est vraiment pas bien. Il sort des bureaux pour se changer les idées. Sans dire grand chose. L’équipe de DeepMind n’ose pas revenir vers lui. L’ont-ils touché dans son ego ? Plusieurs heures passent, sans que Fan Hui ne donne de signe de vie.

Dans Londres, Fan Hui erre. Les questions fusent dans sa tête. Il en même arriver à se remettre en question. Pourquoi ? Où vais-je ? Que n’ai-je ? Le jeu de go est un mirroir et il ne comprend pas ce qu’il a vu lors de cette partie. Qui était cet adversaire inerte et pourtant si puissant ?

Médiatisation

Quelques semaines plus tard, en janvier 2016, DeepMind publie un papier dans la revue scientifique Nature en présentant le projet AlphaGo. Beaucoup d’attention arrive sur ce projet et ce champion européen battu par la machine. Les commentaires se déchaînent. La femme de Fan Hui l’appelle pour lui conseiller de ne pas regarder internet. Ce joueur “n’est pas un vrai joueur de go, il s’est fait battre par un ordinateur.”

Pour en arriver là, les chercheurs ont bien évidemment entraîné AlphaGo. Tout d’abord, ils lui ont montré 100.000 vidéos de parties récupérées depuis internet. Le but était lui montrer comment l’intuition humaine se traduisait en déplacements de jetons.

Après cette première phase, AlphaGo a joué contre lui-même des millions de fois, apprenant toujours plus et testant toujours plus de possiblités.

Nouveau challenge

Fort de ce succès scientifique et médiatique, DeepMind souhaite pousser son projet un cran au dessus. Une rencontre avec un des meilleurs joueurs du monde est organisée. Ce joueur est Lee Sedol, joueur coréen de 9e dan (le plus haut niveau), cumulant 18 titres mondiaux, véritable star en Corée. Difficulté supplémentaire, Lee Sedol est connu pour avoir un jeu très créatif.

Quelques semaines avant la rencontre, AlphaGo s’entraîne et les scientifiques se rendent compte qu’il a perdu d’une manière ridicule. Si cela se reproduit en Corée, un très mauvais signal sera envoyé et DeepMind deviendra la risée des Internets.

Fan Hui est recruté en tant que conseiller. Il joue toute la journée afin de déceler la moindre faille du programme.

Après des heures et des heures, Fan Hui trouve une configuration où AlphaGo réagit très mal. La rencontre est dans quelques jours à peine. Les chercheurs font le maximum pour corriger la faille.

La suite, au prochain épisode.

Suivez les dernières actualités de l’Intelligence Artificielle avec FocusAI, la newsletter hebdomadaire. C’est gratuit, ça se lit en moins de 3 minutes et c’est tous les vendredi : https://focusai.substack.com/

Maxime 🙃

--

--

Maxime Pawlak

#dataScientist #techplorator #prototypeur #entrepreneur