ChatGPT humilié par un jeu d’échecs sur Atari 2600

Un ingénieur de chez Citrix, Robert Caruso, a eu l’idée de confronter ChatGPT à un programme d’échecs des plus rudimentaires : Video Chess sur Atari 2600. Ce qui devait être une simple expérience amusante s’est rapidement transformé en un véritable naufrage pour l’intelligence artificielle d’OpenAI, pourtant considérée comme l’une des plus avancées au monde.

Tout a commencé lorsque Caruso discutait avec ChatGPT de l’histoire de l’intelligence artificielle dans les échecs. Le chatbot s’est alors montré particulièrement confiant, allant jusqu’à proposer de jouer contre un programme d’échecs simpliste pour démontrer à quelle vitesse il pourrait gagner. Plus précisément, il voulait « mesurer le temps qu’il lui faudrait pour battre un jeu ne réfléchissant qu’à un ou deux coups à l’avance sur un processeur de 1,19 MHz », selon les propos de l’ingénieur partagés sur LinkedIn.

Mais la suite ne s’est pas déroulée comme prévu.

Malgré sa prétention initiale, ChatGPT a été mis en échec dès le niveau débutant. Il a enchaîné les erreurs : confondant les tours avec les fous, ignorant les fourchettes de pions et perdant constamment de vue la position de ses propres pièces. Même en recevant une représentation de l’échiquier pour l’aider à identifier les pièces, l’IA s’est plainte que les icônes de l’Atari étaient trop abstraites. Et même après avoir basculé vers une notation classique des échecs, les résultats n’ont guère été meilleurs.

Caruso a dû, pendant 90 minutes, interrompre à plusieurs reprises les mauvais coups de ChatGPT et corriger ses erreurs de positionnement, parfois plusieurs fois par tour. À chaque tentative, le chatbot promettait qu’il ferait mieux s’il pouvait recommencer la partie. Mais même avec des redémarrages, les erreurs persistaient.

Il faut rappeler que Video Chess, lancé à l’époque où les contraintes techniques étaient extrêmes, fonctionne avec à peine 4 Ko de mémoire, le double des 2 Ko habituels des autres jeux sur la console VCS. Le programme utilise une méthode de calcul brut pour choisir le « meilleur » coup possible, sans véritable stratégie ou vision à long terme. Pourtant, un joueur humain moyen parvient généralement à le battre sans difficulté.

La piètre performance de ChatGPT illustre une réalité importante : aussi impressionnants que soient les modèles de langage, ils ne sont pas conçus pour exceller dans des domaines spécialisés comme les échecs. Contrairement à des moteurs comme Stockfish ou AlphaZero de DeepMind, qui dominent largement ce domaine, ChatGPT n’a ni l’architecture ni les algorithmes nécessaires pour rivaliser sur l’échiquier.

Finalement, ChatGPT a fini par admettre sa défaite, tête basse. Un moment d’humilité pour une IA qui, si elle brille en rédaction ou en conversation, a encore du chemin à faire avant de battre même les plus simples des adversaires électroniques.