AlphaGo — Quand la machine défie l’homme — 3/3

Maxime Pawlak
6 min readSep 22, 2020

Dans ce 3ème et dernier post de cette trilogie, nous nous finirons de commenter la rencontre entre AlphaGo et Lee Sedol avant de conclure.

Pour retrouver les autres posts, suivez ces liens :

Précédemment, AlphaGo mène la partie face à Lee Sedol. Après avoir perdu les 3 premières parties, Lee Sedol vient de remporter la 4è partie. La 5e et dernière partie est sur le point de commencer.

Round final

Dernière journée de cette rencontre épique. Les journalistes sont encore plus nombreux et plus impatients. Lee Sedol a battu AlphaGo. Et s’il avait trouvé la faille…

La partie démarre. L’ambiance a changé. Après un coup d’AlphaGo, les commentateurs sont sceptiques. Ils ironisent : AlphaGo ne s’est peut être pas remis de sa partie d’hier.

Tout l’équipe s’interrroge ? Court-circuit ? Lee Sedol prend la confiance en voyant ses coups.

Pourtant, les indicateurs confortent le programme de DeepMind : AlphaGo gagne avec une probabilité de 91%.

Les coups étranges continuent. AlphaGo a-t-il perdu la face ?

L’équipe de DeepMind sent qu’il y a un souci. Mais, ironiquement, elle ne s’y connaît pas assez experts pour expliquer quoi.

L’être humain prend bien vite la confiance et aime conforter son ego.

Au jeu de Go, tu n’as besoin de gagner que par un point. Il n’est pas nécessaire de ridiculiser ton adversaire en le battant à plate couture.

La partie se termine. On fait les comptes. AlphaGo gagne avec 1.5 point d’avance.

Personne n’en revient. Quatre à un.

La rencontre est terminée.

L’équipe de DeepMind remercie Lee Sedol et vice-versa.

Selon les mots de Lee Sedol, AlphaGo a apporté du nouveau dans le jeu de go. Il amène une nouvelle sorte de créativité.

De la même manière, Lee Sedol a appris sur lui et sur le jeu de Go. Ce nouvel adversaire a ouvert son lot de questions au plus profond du champion.

Le documentaire se termine.

Il est précisé que Lee Sedol a gagné toutes les compétitions “humaines” qui ont suivi cette rencontre.

Fan Hui a gagné en 2016 le championnat européen. Les plateaux du jeu de go ont été en rupture de stock pendant plusieurs semaines.

Documentaire réalisé par Greg Khos.

AlphaGo, la suite

En janvier 2017, l’équipe de DeepMind annonce qu’elle a disputé plus de 60 parties contre les meilleurs joueurs mondiaux (dont le numéro 1 mondial Ke Jie) et qu’elle les a toutes remportées.

DeepMind annonce alors qu’AlphaGo ne participera plus à d’autres compétitions et sera remplacé par un outil d’apprentissage pour les joueurs humains.

En octobre 2017, DeepMind annonce un nouveau développement : AlphaGo Zero. Ce programme utilise une architecture simplifiée et ne s’est entraîné qu’en jouant uniquement contre lui-même. Il atteint le niveau débutant en trois heures. Il bat 100 à 0 la version ayant battu Lee Sedol après 72 heures. Après 40 jours d’entraînement, il bat la version de mai 2017 (dite « Master ») 89 parties sur 100.

Mot de la fin

Ce documentaire m’a donné envie de tester le jeu de go.

Il est très enrichissant. Personnellement, j’ai été parcouru par beaucoup de sentiments différents :

  • lorsqu’AlphaGo n’était pas pris au sérieux par la communauté, j’ai d’abord été challengeur et optimiste en espérant qu’il prouve à tout le monde le contraire ;
  • un peu de satisfaction en voyant le status quo, représenté par Lee Sedol, perdre ses moyens face à cet adversaire innovant ;
  • cette satisfaction a vite été remplacée par de l’empathie envers Lee Sedol, tellement il apparaîssait désemparé face à cet ultime adversaire sorti de nulle part et surpuissant ;
  • de l’admiration à voir autant d’humilité des deux côtés, dans l’équipe de DeepMind mais surtout chez Lee Sedol. Quel courage et séreinité !
Photo by Vicky Yu on Unsplash

La notion de créativité est abordée ci et là tout au long du documentaire. Il est intéressant de comprendre comment AlphaGo a acquéri la sienne.

Il s’est simplement appuyé sur ce qu’il a vu des parties humaines, pour ensuite peaufiner sa technique en jouant contre lui même. Néanmoins, une fois acquises, ses compétences sont figées. Lorsque DeepMind se rend compte qu’AlphaGo est fragile dans une situation particulière, les chercheurs mettent une énergie folle pour corriger cela. D’ailleurs, nous ne savons pas vraiment s’il était corrigé pour la rencontre en Corée. Implémenter un nouveau cas, même le plus petit, peut être complexe. A l’inverse, Lee Sedol a adapté son jeu pour comprendre son adversaire afin d’identifier des failles. Il a réussi cela en 3 parties seulement. Trois parties espacées que d’une nuit de réflexion entre chacune. AlphaGo a joué des millions de fois contre lui même, sans s’apercevoir de cette faille.

Tout ça pour rebondir sur la citation de Kasparov, premier champion du monde d’échecs à être battu au début des années 2000 par un ordinateur :

The best combination is a good human plus a machine.

AlphaGo n’a eu de cesse de s’améliorer grâce à l’expertise humaine des champions. Mais une fois transmisse, AlphaGo est devenu ultra spécialisé et devient une force brute pour résoudre le problème pour lequel il a été conçu.

Photo by Randy Fath on Unsplash

L’intelligence artificielle, et même au sens plus large la technologie, est un outil capable de réaliser des prouesses. Chaque semaine apporte son lot de nouveaux papiers de recherches et de nouveaux services. Jusqu’où irons-nous ? Sûrement très loin. Mais surtout, de quelle technologie voulons-nous ?

L’usage que nous faisons de ces technologies façonnent déjà notre demain. Que voulons-nous pour la suite ? Réfléchissons à la reconnaissance faciale, à l’automatisation de tous les secteurs : industrie, automobile, armement… La technologie reste un outil. Faisons preuve d’intelligence pour qu’elle nous serve à améliorer notre monde plutôt qu’elle nous asservisse davantage et nous prive de notre rélfexion et de notre créativité.

Photo by Mohamed Nohassi on Unsplash

Sur ces paroles, je vais vous laisser. N’hésitez à me faire remonter les possibles erreurs ou maladresses qui se seraient glissées dans mon récit. Vous trouverez toutes les sources ci-desosus.

Au plaisir d’en discuter autour d’un verre 😉.

ps : j’ai acheté un tablier de go. Je cherche des partenaires pour jouer…

Suivez les dernières nouveautés de l’Intelligence Artificielle avec FocusAI, la newsletter hebdomadaire. C’est gratuit et c’est tous les vendredi : https://focusai.substack.com/

Maxime 🙃

--

--

Maxime Pawlak

#dataScientist #techplorator #prototypeur #entrepreneur