Alpha Zéro de la société DeepMind-Google révolutionne la programmation du jeu d'échecs

Certains programmeurs restaient assez septique sur la réussite de l'adaptation de la méthode de 
l'apprentissage profond ( deep learning ), aussi appelé algorithme d'apprentissage de renforcement général, 
au jeu d'échecs comme pour Alphago au jeu de go.
Apparemment, la réussite est pourtant totale en observant les résultats obtenus 
face à l'un des meilleurs programmes de jeu nommé Stockfish.

En effet, selon DeepMind, après 9 heures d'entraînement face à lui-même et 44 millions de parties 
Alpha Zéro, avec son algorithme d'apprentissage de renforcement général, 
a assimilé le jeu d'échecs. Il a ensuite rencontré le programme Stockfish version 2016 
dans un match de 1.300 parties avec un temps de réflexion d'une minute par coup. 
Le résultat laisse incrédule beaucoup de connaisseurs...et semble presque irréel.

victoires Alpha zéro                                         nulles                                      victoires Stockfish
318                                                       958                                                   24

 

Cela reste a confirmer, DeepMind a transmis 10 parties que vous pouvez étudier. ( voir ci-dessous )

Pour en savoir plus :