Nouveau succès au jeu de go pour l'IA

Intelligence artificielle Le programme AlphaGo s'est fait terrasser par une nouvelle version de lui-même, capable d'apprendre sans l'aide des humains.

Selon les concepteurs du programme, ce dernier n'est «plus contraint par les limites de la connaissance humaine». (Mercredi 18 octobre 2017)

Selon les concepteurs du programme, ce dernier n'est «plus contraint par les limites de la connaissance humaine». (Mercredi 18 octobre 2017) Image: Archive/AFP

Signaler une erreur

Vous voulez communiquer un renseignement ou vous avez repéré une erreur?

AlphaGo, le super-ordinateur qui avait fait sensation l'an dernier en battant le champion du monde de go, est tombé sur plus fort que lui. Il a été écrasé par une nouvelle version de ce programme, capable d'apprendre par lui-même, sans la connaissance humaine.

«Le plus fort joueur de go de l'histoire»

AlphaGo Zero, ce nouveau programme «plus puissant», victorieux sur le score sans appel de 100 à 0, «est sans doute le plus fort joueur de go de l'histoire», estiment Demis Hassabis et David Silver, deux de ses concepteurs, selon une étude publiée mercredi dans la revue Nature.

Au jeu de go, le nombre de combinaisons possibles est astronomique, plus grand que le nombre d'atomes dans l'univers. Les programmes informatiques, bien que très forts en calcul, ne peuvent donc pas passer en revue toutes les possibilités pour choisir la bonne mais doivent imiter les concepts stratégiques de l'homme.

Pour battre en 2016 Lee Se-Dol, grand maître sud-coréen du jeu de go (par quatre parties à une), AlphaGo avait été nourri des milliers de parties jouées par des professionnels et des amateurs, lui permettant ainsi «d'apprendre», pendant plusieurs mois, à copier le raisonnement humain par l'apprentissage profond («deep learning» en anglais).

Trois jours d'entraînement

AlphaGo Zero, également développé par le britannique DeepMind, une filiale de Google spécialisée dans l'intelligence artificielle, est pour sa part capable «d'apprendre tout seul à jouer au go», précise l'étude.

Pour s'entraîner, AlphaGo Zero joue contre lui-même, «en partant de 0» sans autre connaissance sur le go que les règles du jeu. Contrairement à AlphaGo, il n'a donc pas eu besoin de se confronter à des humains pour devenir imbattable.

«Après trois jours d'entraînement (presque 5 millions de parties, ndlr) en autodidacte, il a battu la version de 2016 d'AlphaGo», expliquent Demis Hassabis et David Silver sur un blog.

Toujours besoin des humains

Et alors qu'AlphaGo nécessitait plusieurs machines, son successeur fonctionne avec une seule. «Ce n'est pas le premier logiciel qui apprend par lui-même, la nouveauté c'est que AlphaGo Zero soit si bon», souligne le futurologue Anders Sandberg de l'Université d'Oxford.

La victoire d'AlphaGo sur Lee Se-Dol l'an dernier avait fait sensation: c'était la première fois qu'un logiciel écrasait un joueur chevronné lors d'un match entier. Cette victoire avait été saluée comme une percée technologique pour les ordinateurs, désormais capables non seulement de conduire des voitures mais aussi d'aider l'humanité à résoudre quelques-uns des problèmes scientifiques, techniques ou médicaux les plus ardus.

Déjà en 1997, le champion du monde d'échecs Garry Kasparov avait été vaincu par l'ordinateur Deep Blue d'IBM. Mais le défi pour la machine semblait bien plus relevé au jeu de go, dans lequel deux adversaires tentent d'occuper le plus d'espace sur un plateau quadrillé en plaçant alternativement des pierres noires et blanches.

Nouvelle étape franchie

Avec AlphaGo Zero, une nouvelle étape est franchie, dans la mesure où le logiciel, pour apprendre, n'est «plus contraint par les limites de la connaissance humaine», selon les concepteurs de DeepMind.

Dans certains domaines, les connaissances peuvent être difficiles à réunir voire inexistantes. Il est alors difficile de «nourrir» les logiciels d'exemples et de données pour leur permettre de s'entraîner. L'autoapprentissage permet de sauter cette étape parfois difficile à mettre en place.

Mais si elle peut se passer avec succès de l'expérience humaine pour se perfectionner, la machine dépend néanmoins toujours de l'intelligence des hommes: «Les brillantes idées qui ont permis d'améliorer le programme ont été générées par l'homme», précise Anders Sandberg. «AlphaGo ne se programme pas tout seul !». (ats/nxp)

Créé: 18.10.2017, 21h43

Articles en relation

L'intelligence artificielle «menace» le journalisme

Technologie Selon une étude, les médias doivent participer au développement de l'intelligence artificielle s'ils ne veulent en subir les bouleversements. Plus...

L’IA, une menace pour l'humanité?

Technologie Les Nations Unies vont ouvrir un centre aux Pays-Bas pour surveiller le développement de l'intelligence artificielle. Vidéo. Plus...

L'intelligence artificielle dope l'économie

Economie L'économie mondiale devrait grandement profiter des avantages offerts par une intelligence artificielle en plein essor. Plus...

Publier un nouveau commentaire

Nous vous invitons ici à donner votre point de vue, vos informations, vos arguments. Nous vous prions d’utiliser votre nom complet, la discussion est plus authentique ainsi. Vous pouvez vous connecter via Facebook ou créer un compte utilisateur, selon votre choix. Les fausses identités seront bannies. Nous refusons les messages haineux, diffamatoires, racistes ou xénophobes, les menaces, incitations à la violence ou autres injures. Merci de garder un ton respectueux et de penser que de nombreuses personnes vous lisent.
La rédaction

Caractères restants:

J'ai lu et j'accepte la Charte des commentaires.

No connection to facebook possible. Please try again. There was a problem while transmitting your comment. Please try again.

Caricatures

Suisse-UE: Toujours pas d'accord-cadre
Plus...