
Nouveautés + tendances
Meta prise en flagrant délit d'embellissement des benchmarks d'IA
par Samuel Buchmann
L'environnement ouvert et les tâches variées du célèbre jeu informatique Minecraft constituent un ballon d'essai idéal pour les modèles d'IA. Ils peuvent y démontrer leurs capacités.
L'aspect pixelisé de Minecraft est devenu culte. Le jeu informatique consiste à explorer un monde ouvert et à construire des bâtiments. Avec plus de 300 millions d'exemplaires vendus, il s'agit du jeu informatique le plus vendu. Et il sert désormais de ballon d'essai pour les modèles d'IA. Dans la revue "Nature", Timothy Lillicrap et ses collègues de Google DeepMind présentent un algorithme d'IA qui, pour la première fois, a appris de manière autonome à extraire des diamants dans l'univers du jeu vidéo, une action qui nécessite une réflexion stratégique à long terme.
"Minecraft pose deux défis particuliers aux algorithmes d'IA", explique l'informaticien Philipp Henning, qui n'a pas participé aux travaux actuels. Premièrement, le monde du jeu généré aléatoirement est différent à chaque partie, ce qui ne permet pas aux modèles de mémoriser une séquence d'actions fixe pour obtenir de bons résultats. "Deuxièmement, le jeu exige des plans à long terme, comme l'extraction de diamants. En effet, celle-ci nécessite de nombreuses étapes successives qui ne sont que peu récompensées - ce n'est qu'à la toute fin que l'action est payante. C'est pourquoi l'extraction de diamants dans Minecraft est devenue un ballon d'essai pour le développement de modèles d'IA prédictifs. Entre 2019 et 2022, des concours ont même été organisés à ce sujet. "Dreamer est le premier algorithme à extraire des diamants de manière autonome dans Minecraft, franchissant ainsi une étape importante dans le domaine de l'intelligence artificielle", écrivent les spécialistes de DeepMind dans leur publication.
L'algorithme de Dreamer apprend de manière autonome à partir des interactions avec l'environnement grâce à ce que l'on appelle l'apprentissage par renforcement. Par exemple, si l'IA gagne des points en effectuant une action dans Minecraft, elle apprend que cette action est payante - et la reproduira probablement à l'avenir. Dreamer se compose de trois parties : "Le premier modèle prédit les conséquences des actions possibles, un réseau neuronal critique évalue la valeur de chaque conséquence, et le troisième réseau neuronal sélectionne les actions pour obtenir les meilleurs résultats", peut-on lire dans le document. Le modèle d'IA a ainsi pu apprendre plus de 150 tâches différentes dans Minecraft.
Du point de vue actuel, les capacités de l'architecture Dreamer sont un peu moins impressionnantes.
Si le travail n'a été publié dans "Nature" qu'en avril 2024, il date déjà de janvier 2023 - date à laquelle DeepMind l'a soumis à l'examen des pairs. "Elle a été perçue comme un grand succès à l'époque, car le monde ouvert du jeu Minecraft était considéré comme une référence exigeante", explique Henning. Mais "on sait que depuis, l'intelligence artificielle a fait de grands bonds en avant."
"D'un point de vue actuel, les capacités de l'architecture Dreamer sont un peu moins impressionnantes", juge Henning. Par exemple, en novembre 2024, un travail de recherche qui n'a pas encore été évalué par des pairs a montré que plusieurs grands modèles de langage contrôlaient plus de 1000 personnages de Minecraft et faisaient preuve d'un comportement étonnamment humain : les joueurs IA jouaient différents rôles, comme défenseur, constructeur ou explorateur, et certains partaient même en mission. Nous verrons combien de temps il faudra pour que ce travail soit publié dans une revue spécialisée.
Nous sommes partenaires de Spectre des Sciences et souhaitons vous rendre les informations fondées plus accessibles. Suivez Spectre des Sciences si vous aimez ses articles.
Originalartikel auf Spektrum.deDes experts de la science et de la recherche rendent compte des dernières découvertes dans leur domaine – de manière compétente, authentique et compréhensible.