Elon Musk reconnaît que nous avons épuisé les données de formation sur l’IA

Elon Musk est d’accord avec d’autres experts en IA sur le fait qu’il reste peu de données réelles sur lesquelles former des modèles d’IA.

« Nous avons désormais pratiquement épuisé la somme cumulée des connaissances humaines…. dans la formation en IA », a déclaré Musk lors d’une conversation en direct avec le président de Stagwell, Mark Penn, diffusée sur X mercredi soir. « Cela s’est produit essentiellement l’année dernière. »

Musk, propriétaire de la société d’IA xAI, a fait écho aux thèmes évoqués par l’ancien scientifique en chef d’OpenAI, Ilya Sutskever, lors de NeurIPS, la conférence sur l’apprentissage automatique, lors d’un discours en décembre. Sutskever, qui a déclaré que l’industrie de l’IA avait atteint ce qu’il appelle un « pic de données », a prédit que le manque de données de formation obligerait à s’éloigner de la manière dont les modèles sont développés aujourd’hui.

En effet, Musk a suggéré que les données synthétiques – les données générées par les modèles d’IA eux-mêmes – constituent la voie à suivre. « La seule façon de compléter (les données du monde réel) est d’utiliser des données synthétiques, où l’IA crée (des données de formation) », a-t-il déclaré. « Avec les données synthétiques… (l’IA) s’auto-évaluera et passera par ce processus d’auto-apprentissage. »

D’autres entreprises, notamment des géants de la technologie comme Microsoft, Meta, OpenAI et Anthropic, utilisent déjà des données synthétiques pour former des modèles d’IA phares. Gartner estime que 60 % des données utilisées pour les projets d’IA et d’analyse en 2024 ont été générées de manière synthétique.

Le Phi-4 de Microsoft, qui était open source mercredi matin, a été formé sur des données synthétiques parallèlement à des données du monde réel. Il en était de même pour les modèles Gemma de Google. Anthropic a utilisé des données synthétiques pour développer l’un de ses systèmes les plus performants, Claude 3.5 Sonnet. Et Meta a peaufiné sa plus récente série de modèles Llama à l’aide de données générées par l’IA.

La formation sur les données synthétiques présente d’autres avantages, comme des économies de coûts. La startup d’IA Writer affirme que son modèle Palmyra X 004, qui a été développé à partir de sources presque entièrement synthétiques, n’a coûté que 700 000 dollars à développer, contre 4,6 millions de dollars estimés pour un modèle OpenAI de taille comparable.

Mais il y a aussi des inconvénients. Certaines recherches suggèrent que les données synthétiques peuvent conduire à l’effondrement du modèle, où celui-ci devient moins « créatif » – et plus biaisé – dans ses résultats, compromettant finalement sérieusement sa fonctionnalité. Étant donné que les modèles créent des données synthétiques, si les données utilisées pour former ces modèles présentent des biais et des limites, leurs résultats seront également entachés.

Eleon Lass

Eleanor - 28 years I have 5 years experience in journalism, and I care about news, celebrity news, technical news, as well as fashion, and was published in many international electronic magazines, and I live in Paris - France, and you can write to me: eleanor@newstoday.fr

Share
Published by
Eleon Lass

Recent Posts

La star d’ABC, James Longman, révèle la tragédie choquante qui a secoué sa famille : « C’était comme si une bombe avait explosé »

La star d'ABC, James Longman, a déclaré que c'était comme une "bombe explosée" lorsque son…

4 jours ago

Trump veut changer les universités à l’échelle nationale. Les États dirigés par le GOP offrent un aperçu

Il y a près de dix ans, d'intenses manifestations contre l'injustice raciale ont secoué le…

4 jours ago

Incendie à Hollywood Hills: Une Tragédie en Cours

L'incendie à Hollywood Hills a captivé l'attention du monde entier, non seulement en raison de…

4 jours ago

Les marchés obligataires sont ouverts. Pourquoi les rendements à long terme sont un cauchemar pour les actions. -Barron’s

Les marchés obligataires sont ouverts. Pourquoi les rendements à long terme sont un cauchemar pour…

4 jours ago

xAI teste une application iOS autonome pour son chatbot Grok

La société d'IA d'Elon Musk, xAI, teste une application iOS autonome pour son chatbot, Grok,…

4 jours ago