La start-up japonaise d’intelligence artificielle Sakana AI a dévoilé son nouveau modèle, baptisé « The AI Scientist », dans un article publié le 13 août. Le modèle, développé conjointement avec les universités d’Oxford et de Colombie-Britannique, a été conçu pour mener des recherches scientifiques. Selon Sakana AI, il peut automatiser certaines des étapes nécessaires à la découverte scientifique.
15 $ par article scientifique, selon Sakana AI
« The AI Scientist » s’appuie sur de grands modèles de langage (LLM) qui peuvent reproduire le processus de découverte scientifique. Il peut générer une idée et évaluer son caractère nouveau et novateur. Le modèle modifie ensuite une base de code open source disponible sur GitHub à l’aide d’outils de génération de code. Vient ensuite la phase d’expérimentation, au cours de laquelle il collecte des données numériques et des résumés visuels.
A partir de ces éléments, le modèle rédige un rapport en langage LaTeX (largement utilisé par la communauté scientifique), avec des résultats justifiés et contextualisés. Sakana utilise l’outil Semantic Scholar, développé par l’Allen Institute for AI, pour trouver de manière autonome des articles pertinents et étayer le rapport. La start-up a enfin mis en place un générateur de revues automatisé, afin d’affiner le modèle et de créer une boucle ouverte
Sakana AI affirme qu’il est possible de produire un article scientifique pour seulement 15 dollars (13,73 euros), en fonction des ressources de calcul utilisées. Lors de la phase de test, l’outil a proposé de nouvelles techniques pour les modèles de langage basés sur une architecture de transformateur (modèles auto-attentifs) et pour les modèles de diffusion.
Un premier modèle du genre qui présente quelques limites
Un tel modèle pourrait accélérer la recherche dans de nombreux domaines, notamment la science des matériaux, la découverte de médicaments et les sciences de l’environnement. Mais il reste encore de nombreuses étapes à franchir avant que ce modèle puisse rivaliser avec ce que font les humains.
En plus de se limiter au développement de logiciels d’IA, « The AI Scientist » nécessite une base de code pour chaque expérience, ce qui peut compromettre sa capacité à créer de nouvelles idées. Sakana précise également que le modèle ne dispose pas de fonctionnalités de vision par ordinateur, ce qui peut créer quelques bugs lors de la génération de contenu visuel pour les articles scientifiques.
Sakana AI développe trois nouveaux modèles
Sakana AI a été fondée l’année dernière par deux anciens chercheurs de Google. La start-up se concentre sur le développement de modèles plus petits et plus spécialisés, plutôt que sur la conception de LLM qui nécessitent une grande puissance de traitement et sont plus gourmands en énergie.
Elle a déjà développé un modèle de langage japonais pour le raisonnement mathématique (EvoLLM-JP), un modèle de langage visuel qui associe compréhension visuelle et capacités linguistiques (EvoVLM-JP) et un modèle de génération d’images optimisé pour une inférence rapide (EvoSDXL-JP). Après avoir levé 30 millions de dollars en fonds d’amorçage, la startup a entamé des négociations pour lever 125 millions de dollars supplémentaires, portant sa valorisation à 1,1 milliard de dollars (1,01 milliard d’euros).
Choisi pour toi