IA: Quand l’intelligence devient relative

I

Il y a 20 ans, l’IA et la logique floue étaient des sujets matheux, complexes et réservés aux « geeks » notamment dans les écoles d’ingénieur.
Aujourd’hui, rebrandé Machine Learning par les sachants commentateurs, le sujet est disruptif et les geeks d’autrefois sont devenus des talents.

Le 18 octobre 2017, un événement majeur fut relaté et publié par Google DeepMind.
Devant le faible impact médiatique, peu d’acteurs en ont, semble-t-il, perçu la portée.

IA: où en etions-nous déjà ?

En 2016, la solution Alpha Go de l’équipe DeepMind avait battu Lee Sedol, un des maîtres actuels du Go, discipline respectée entre toutes du fait de sa complexité combinatoire inouïe et millénaire.
Comme pour Kasparov mis échec & mat par Deeper Blue d’IBM en 1997, ce fut le symbole de la force brute de la machine face à l’être humain.
Mais l’humain lui avait – au préalable – tout donné et tout appris.
L’honneur était (presque) sauf.

Alors bien sur, Deep Blue comme Alpha Go furent construits sur des algorithmes d’apprentissage certes différents, mais tous deux supervisés puis renforcés.

Supervisé ?

Cela signifie que l’algorithme est initialement nourri par des dizaines voire des centaines de milliers de parties historiques. Jouées naguère par des humains, ces parties font référence au point d’être enseignées dans les manuels de jeu d’échecs et de go.

Renforcé ?

Cela signifie que l’algorithme se voit forcer à jouer des milliers de partie contre lui-même, sur la base de cet enseignement (ce « par coeur » diront certains), afin d’approfondir ses stratégies et tactiques de jeu.

Bref, c’est une jolie réussite.
Mais, diront certains, le rejeton informatique ne fait qu’appliquer les principes et les savoirs de son géniteur humain.
Comprenez: son intelligence n’est que quantitative, pas qualitative.

« Sans moi, tu n’es rien mon fils »

Et arriva le 18 octobre 2017

Alpha Go Zero est un algorithme d’un autre type.
Il est « non-supervisé ».
L’homme n’a donné à la machine aucune bible, aucun lexique, aucune histoire du jeu.
Uniquement les règles du Go qui sont parmi les plus simples des jeux de plateau humain.
Et un objectif: vaincre.
Basta.
Cette fois, le géniteur humain annonce à la machine: « Débrouille toi pour apprendre seul, sans mentor, ni manuel ».

DES Résultats quantitatifs et qualitatifs

T0+ 7 heures: l’algorithme atteint le niveau de jeu d’un enfant débutant.
T0+20 heures: il atteint le niveau d’un adulte averti.
T0+70 heures: il bat le programme de 2016 qui avait terrassé Lee Sedol.
T0+20 jours: il écrase les 60 meilleurs joueurs mondiaux avec un ratio de victoire de 89%.
T0+40 jours: il devient absolument imbattable, ne perdant plus un seul match ni contre les humains ni aucun autre adversaire logiciel. Ratio de victoire : 100%

Il fallut par conséquent 40 jours à une machine en totale auto-didactie pour terrasser 3000 ans d’expériences humaines.

Et vous pensez que ce fut au prix d’un délire de puissance ?
Que nenni, la consommation de puissance informatique d’Alpha Go Zero nécessite 12 fois moins de machines et de puissance électrique que son prédécesseur de 2016.

C’est tout un symbole en cette fin d’année 2017: l’algorithme en parfaite autonomie et à partir d’une feuille blanche est capable d’inventer des stratégies et des tactiques, plus puissantes que nos intelligences collectives.

Ce serait anecdotique, si cela ne touchait que le monde du jeu de Go, qui il est vrai ne concerne pas grand monde en Occident.

Mais voilà, ce n’est pas le cas

L’initiative TensorFlow (impulsée encore une fois par Google) lança fin 2016 le programme Magenta.
Son but ?
Proposer un algorithme d’apprentissage, qui avec le temps pourrait composer de la musique.
Encore et toujours les mêmes sachants commentateurs (pour leur grande majorité non-musiciens qui plus est), avaient l’Axiome fondamental:

« La machine ne pourra JAMAIS rien créer, ni improviser »

Voilà ce que Magenta a composé et interprété en quelques semaines d’apprentissage supervisé, je vous laisse juger:

Sony ne fut pas en reste et son algorithme concurrent composa un morceau pop dans l’esprit des Beatles:

 

Ces initiatives n’en sont encore qu’au stade de l’ « enfance algorithmique », et sont aujourd’hui basées essentiellement sur des modes supervisés.
Les sachants commentateurs ont encore l’excuse: « Sans moi, tu n’es rien mon fils ».
Oui. Jusqu’à quand ?

Mais il y a bien plus impressionnant

Toujours dans l’équipe DeepMind, un jeune doctorant Scott Reed a publié il y a quelques semaines les premiers résultats de ses recherches.

L’idée est de générer des images, sur une demande formulée par la voix ou par écrit.
On ne parle pas ici de rechercher un document dans une banque d’images: c’est déjà maîtrisé depuis longtemps par les GAFA, et même votre téléphone sait déjà le faire depuis quelques années.
Il est question ici de GENERER PIXEL PAR PIXEL une image qui n’existe pas au préalable, sur une demande explicite d’un individu tiers.

Par exemple, à la demande:
« Montre moi un oiseau jaune avec une tête noire, des yeux et un ventre orange »,
l’algorithme répond:

Pour une même demande répétée plusieurs fois, l’algorithme n’étant pas déterministe, il ne répond pas rigoureusement le même résultat, comme présenté ci-dessous:

Aucune de ces images n’a été photographiée, ou dessinée au préalable. Elles sont générées à la demande par l’algorithme.

Ces recherches ne sont qu’embryonnaires à ce stade, mais je pense que vous en percevez déjà la puissance.

Nous entrons dans L’ère du Machine Generated Content 

Que voyons-nous donc aujourd’hui ?
L’algorithme sait :

  • produire des stratégies et des tactiques victorieuses à partir d’une page blanche
  • composer et improviser de la musique, en comprenant ce que sont l’harmonie et la mélodie
  • générer des images, sous contrainte de sens et de réalisme

En un mot, la machine est maintenant créative et créatrice. Seule.
Rien n’empêchera dans le futur à la machine de générer elle-même des algorithmes, pour améliorer les siens (initiative AutoML de Google).
Et la vitesse géométrique à laquelle elle semble apprendre, ce futur n’est peut-être pas aussi éloigné que certains sachants commentateurs le disent.

l’intelligence devient relative

Pour remettre ces événements en perspective, parcourons rapidement la brève histoire des 20 dernières années:

  • 1995: Internet a connu sa première phase avec les sites et les blogs: des amateurs avertis et des professionnels rédigeaient des contenus pour leur public.
  • 2005: les réseaux sociaux ont permis l’avénement du User Generated Content, où tout un chacun est un potentiel influenceur voire un marketeur de sa propre vie numérique. Cela  constitue d’ailleurs une mine d’or pour les algorithmes de recommendations et de publicité online, qui firent la fortune des actuels GAFA.
  • 2010’s: la folie des smartphones engendre peu à peu la folie du Digital, où des produits ringards comme les chatbots apparaissent en une de certains magazines commentateurs sachants.
  • 2017: Nous entrons dans l’ère du Machine Generated Content: textes, images, sons, et demain sans doute odeurs (des initiatives sont déjà en route) seront créés par la machine pour nous séduire, nous amuser, nous informer… nous influencer ?

La réalité virtuelle ne pourra que s’en abreuver pour créer des mondes/oeuvres toujours plus réalistes et surtout, plaisants.
Cela posera bien entendu de nouvelles questions d’éthique, quant au contrôle, à la conscience, à l’objectivité et au rapport à la vérité.

Mais qui s’en soucie dans Matrix ?

« Ignorance is bliss »

Cypher

ref: https://deepmind.com/blog/alphago-zero-learning-scratch/

ref: https://deeplearnjs.org/demos/performance_rnn/index.html

About the author

chen
chen

Digital Strategist, CTO & Architecte Cloud