Nouvelles

OpenAI lance GPT-4o, un nouveau modèle d’IA générative, accessible à tous et doté d’un « mode vocal »

OpenAI, l’éditeur de ChatGPT, a présenté lundi son nouveau modèle d’intelligence artificielle (IA) générative, GPT-4o, qui permet au chatbot d’interagir avec ses utilisateurs tel un assistant vocal ultra sophistiqué. « Vous avez la transcription, l’intelligence et la capacité de parler, réunis pour vous apporter le mode voix », a résumé Mira Murati, directrice technologique de la start-up californienne, lors d’une vidéo de présentation diffusée en direct lundi matin.

Avec deux de ses collègues, elle a démontré comment les utilisateurs pourront interagir avec ChatGPT, lors de conversations fluides, reproduisant de manière étonnante les discussions entre humains. La présentation de l’entreprise qui a lancé la révolution de l’intelligence artificielle générative était très attendue, alors que les géants de la tech multiplient les annonces de nouveaux outils d’IA, toujours plus performants et personnalisés.

L’assistant IA d’OpenAI, que les utilisateurs peuvent facilement interrompre, est capable de lire les émotions sur leurs visages via la caméra de leur smartphone, de les guider pour faire des exercices de respiration, de leur raconter une histoire ou encore de les aider à résoudre un problème de mathématiques. « Vous avez l’air heureux, avec un soupçon d’excitation. (…) Veux-tu me dire quelle est la source de toute cette bonne humeur ? », a demandé la machine à un ingénieur OpenAI.

Lorsqu’il a répondu qu’il montrait au public à quel point elle était « utile et fabuleuse », elle s’est exclamée en retour : « Oh arrête, tu me fais rougir. » Mira Murati a insisté sur le fait que le nouveau modèle GPT-4o est censé apporter à tous ses utilisateurs ses capacités les plus avancées, en matière de production et de compréhension de textes, d’images, de sons et de voix, via ChatGPT. « Nous sommes vraiment ravis de proposer GPT-4o à tous nos utilisateurs gratuits. Les utilisateurs payants continueront de bénéficier de limites d’utilisation cinq fois supérieures à celles des utilisateurs gratuits », a-t-elle détaillé.

« La magie »

Depuis le lancement de ChatGPT fin 2022 – son modèle de langage capable de générer du texte sur une simple requête dans le langage courant – Microsoft, principal investisseur dans OpenAI, Google et toute la Silicon Valley se sont engagés dans une course aux outils et outils d’IA. assistants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft organise un événement presse et développeurs la semaine prochaine.

Vendredi, Sam Altman a démenti les rumeurs sur les annonces que préparait son entreprise : « Pas GPT-5, pas un moteur de recherche », a-t-il déclaré sur X (anciennement Twitter). « Mais (…) nous avons travaillé sur de nouvelles choses et nous pensons que les gens vont les adorer », a-t-il ajouté. « Pour moi, c’est comme de la magie. » Le milliardaire trentenaire met régulièrement en avant sa vision d’une IA qui sera un jour « généraliste », c’est-à-dire dotée de capacités cognitives humaines, capable de réaliser des avancées scientifiques au service de l’humanité.

VIDÉO. « Bonjour, on parle ensemble ? » » : nous avons testé ChatGPT en vocal

OpenAI était valorisé à environ 80 milliards de dollars, selon le New York Times, lors d’une vente d’actions en février dernier. Et selon le Financial Times, ses revenus annuels avoisinent les 2 milliards de dollars depuis décembre 2023, un niveau de croissance exceptionnel comparable à une poignée d’autres start-up de la région, dont Google et Meta (Facebook).

Cammile Bussière

One of the most important things for me as a press writer is the technical news that changes our world day by day, so I write in this area of technology across many sites and I am.
Bouton retour en haut de la page