Selon la startup californienne OpenAI, o1 est capable de raisonner. « o1 réfléchit avant de répondre»a déclaré l’entreprise. « Il peut produire une longue chaîne de pensée interne avant de répondre à l’utilisateur.»
OpenAI, le créateur de ChatGPT, a lancé jeudi 12 septembre o1, un nouveau type de modèle d’intelligence artificielle (IA) générative : selon la start-up californienne, o1 est capable de raisonner et donc de répondre à des questions plus complexes, notamment mathématiques. « o1 réfléchit avant de répondre »OpenAI l’a déclaré dans un communiqué publié en ligne. « Cela peut produire une longue chaîne de pensée interne avant de répondre à l’utilisateur »ajoute la start-up. L’entreprise progresse ainsi vers son objectif de développer une IA « général »c’est à dire une intelligence artificielle mais semblable à celle des humains.
Elle l’a testé en résolvant des problèmes mathématiques ou en produisant des lignes de code, et « Dans de nombreux tests de référence qui nécessitent une forte capacité de raisonnement, o1 rivalise avec les performances des experts humains »OpenAI souligne. Dans un concours de mathématiques destiné aux lycéens américains, o1 s’est classé « parmi les 500 meilleurs étudiants »ajoute l’entreprise.
« Chaîne de pensée »
Avec ChatGPT, OpenAI a lancé fin 2022 la vague de l’IA générative (production de contenu à partir d’une simple requête en langage courant) et est devenue la star de la Silicon Valley. Depuis, de son principal investisseur Microsoft à Google en passant par Meta (Facebook, Instagram), tous les grands groupes technologiques rivalisent d’outils censés aider l’humain dans son quotidien, de l’écriture de messages à l’éducation en passant par la création artistique.
Mais ceux-ci « Assistants IA » Les robots restent des machines qui prédisent – de manière très convaincante – des suites de mots ou des arrangements de pixels, sans conscience et donc sans comprendre leurs phrases ou leurs images. Entraînées sur des montagnes de données collectées en ligne, elles peuvent donc halluciner (inventer des faits) et peiner à résoudre des problèmes mathématiques simples. Et elles fonctionnent comme des boîtes noires pour les utilisateurs.
« Comme un être humain qui peut réfléchir longuement avant de répondre à une question difficile, o1 utilise une chaîne de pensée (…) Il apprend à reconnaître et à corriger ses erreurs. Il apprend à décomposer les étapes délicates en étapes plus simples. Il apprend à essayer une approche différente lorsque l’approche actuelle ne fonctionne pas. »Détails d’OpenAI.
La startup estime que le nouveau modèle représente une amélioration de la sécurité et un alignement avec les valeurs humaines, car « La chaîne de pensée nous permet d’observer le raisonnement du modèle de manière lisible, et le raisonnement du modèle sur les règles de sécurité est plus robuste »La version bêta de o1, connue en interne sous le nom de Strawberry, selon les médias américains, a été mise à la disposition des utilisateurs payants de ChatGPT pour commencer.
hd1