Categories: Nouvelles

OpenAI dévoile GPT-4o, ChatGPT pour ordinateur et un assistant vocal de nouvelle génération

Le 13 mai, lors d’une rare conférence de presse, OpenAI a dévoilé GPT-4o, un nouveau modèle de langage pour ses utilisateurs gratuits et payants. GPT-4o possède un modèle vocal impressionnant, capable de répondre aux questions en temps réel et de commenter le monde à travers des caméras.

Lundi 13 mai, à la veille de la conférence Google I/O, le géant de l’intelligence artificielle OpenAI a organisé l’une des premières conférences de presse de son histoire. Le créateur de ChatGPT, qui utilise habituellement des articles de blog pour faire des annonces, a révélé le nouveau modèle linguistique GPT-4oun nouveau mode ChatGPT Voixl’arrivée de ChatGPT Vision et GPT pour tous les utilisateurs et Application de bureau ChatGPT, sur Mac d’abord, puis sur Windows. GPT-5 et le moteur de recherche OpenAI tant attendu arriveront plus tard.

Avec GPT-4o, OpenAI fait entrer son agent conversationnel dans l’ère du cinéma Son, avec des réponses ultra-rapides, la possibilité de couper ses paroles, des capacités d’imitation et un mode Vision pour commenter un flux vidéo en temps réel. GPT-4o peut également recevoir du texte par copier-coller pendant qu’il parle, pour obtenir des informations. Voici le résumé détaillé de la conférence.

https://twitter.com/OpenAI/status/1790072174117613963?ref_src=twsrc%5Etfw

GPT-4o arrive aujourd’hui dans ChatGPT

Dans les semaines à venir, GPT-4o remplacera GPT-3.5 (gratuit) et GPT-4 (payant). C’est la première fois qu’un nouveau modèle de langage OpenAI est mis à la disposition de tous les utilisateurs de ChatGPT, ce qui peut laisser penser que GPT-5 sera bientôt annoncé. Les abonnés ChatGPT Plus seront les premiers servis (dès aujourd’hui pour les plus chanceux), avant un déploiement plus global. La fonction Voix/Vision arrivera plus tard pour les abonnés Plus en premier.

ChatGPT pour Mac, qui inclut un raccourci clavier pour le déclencher, arrive aujourd’hui. La version Windows arrivera plus tard.

ChatGPT pour Mac. // Source : OpenAI

La grande force de GPT-4o est sa capacité à traiter l’image et l’audio « nativement », quasiment sans délai. OpenAI mise beaucoup sur cet aspect, alors que des rumeurs d’alliance avec Apple pour remplacer Siri par ChatGPT circulent.

Google, lors de sa conférence I/O, a l’intention d’annoncer un concurrent à ChatGPT Voiceégalement capable de commenter les images en temps réel.

Toutes les annonces OpenAI minute par minute (et replay de la conférence)

La conférence d’OpenAI a duré 26 minutes et peut être visionnée sur YouTube. Il est disponible ci-dessous :

Si vous préférez lire une synthèse commentée, Numerama, présent à San Francisco pour Google I/O, vous propose un live blog de la conférence. Les dernières informations apparaissent en haut, vous pouvez aller en bas de page pour suivre la conférence depuis le début :

La conférence peut être suivie en direct sur YouTube

19h29 : Sur Twitter, Sam Altman confirme que le modèle gpt2, divulgué ces derniers jours, était le GPT-4o.

19h26 : OpenAI promet un déploiement de GPT-4o dans les semaines à venir, ainsi que des informations sur « le prochain big thing » (comprendre GPT-5). La conférence est terminée.

19h25 : ChatGPT Voice peut utiliser la caméra pour commenter des choses en temps réel. Dans cette nouvelle démo, il commente le physique de son utilisateur et le complimente. Nous sommes dans Son.

19h23 : L’utilisation abusive de ChatGPT Voice en tant que traducteur (un coup dur pour les applications de traduction). On lui demande de traduire en direct ce que dit l’autre, et il le fait.

19h19 : Nouvelle démo avec l’application ChatGPT pour Mac. On lui parle pour lui demander de l’aide avec le code, on copie et colle ce code et il le commente vocalement. Une belle démo de multimodalité, avec une IA capable de recevoir du texte et de la voix en même temps.

19h15 : Comme le modèle que Google annoncera demain, ChatGPT dispose d’un Mode Vision capable de commenter un flux vidéo en temps réel. C’est assez fou. Il commente en disant ce qu’il voit, avec des plaisanteries et une spontanéité très naturelle.

19h14 : ChatGPT Voice est génial. On peut lui demander de chanter, d’être dramatique, d’imiter une voix de robot. Il imite le comportement humain.

19h11 : Nouveauté importante avec GPT-4o : il peut être interrompu comme dans une vraie conversation, il reconnaît la tonalité et n’a pas de délai de réponse.

19h11 : Nouveau ChatGPT Voix a des intonations encore plus naturelles, répond très rapidement aux questions et fait des blagues. Il n’y a quasiment aucun délai entre la question et la réponse, il imite également la respiration humaine et peut donner des conseils d’intonation.

19h10 : Mark Chen et Barret Zoph rejoignent Mira Murati pour les démos GPT-4o. Nous parlons de conversations vocales en temps réel.

19h10 : GPT-4o est également accessible aux utilisateurs de l’API, avec un temps de réponse publicitaire 5 fois plus rapide que GPT-4 Turbo.

19h07 : Les GPT, les versions personnalisées de ChatGPT, sont désormais disponibles pour les utilisateurs de la version gratuite. Le mode « Vision », pour reconnaître une image, devient également gratuit.

19h06 : GPT-4o remplace GPT-4 et GPT-3.5. C’est la première fois qu’OpenAI déploie un nouveau modèle auprès de tous ses utilisateurs.

19h04 : Nous passons déjà à GPT-4o, la star du jour. OpenAI promet un nouveau modèle révolutionnaire, son premier « omnimodèle », capable de comprendre la voix de manière native.

19h02 : Voici ChatGPT pour Macune véritable application avec des capacités vocales également.

19h01 : Mira Murati, la CTO d’OpenAI, lance le bal. Au programme du jour, l’arrivée d’une application de bureau ChatGPT et d’un nouveau modèle de langage baptisé GPT-4o. Les utilisateurs de la version gratuite y auront également droit.

19h00: La conférence OpenAI démarre ! Tous les responsables d’OpenAI s’amusent à entretenir la hype sur Twitter. Ils promettent des annonces » huit fois supérieur aux attentes ».

18h50 : Google répond ! Sur Twitter, l’entreprise diffuse la vidéo d’un assistant vocal capable de commenter un flux vidéo en direct. OpenAI va avoir de la concurrence. Commence dans 10 minutes.

https://twitter.com/Google/status/1790055114272612771?ref_src=twsrc%5Etfw

18h30: Le site openai.com permet désormais de suivre la conférence sur YouTube. Coup d’envoi dans 30 minutes.

Pas beaucoup d’indices dans la vidéo de pré-présentation. Elle utilise l’expression exacte d’OpenAI pour annoncer sa conférence. // Source : Capture Numerama

18h20 : Selon les dernières rumeurs, OpenAI devrait annoncer un nouveau type d’assistant vocal, capable de conversations spontanées et naturelles, sans délai entre les questions et les réponses. D’autres médias ont évoqué l’arrivée d’un moteur de recherche pour concurrencer Google, mais OpenAI a démenti cette information à Numerama.

18h (9h à San Francisco) : C’est l’heure du réveil pour l’auteur de cet article, qui rejoindra Mountain View dans l’après-midi à la veille du Google I/O. Dans une heure, OpenAI fera des annonces majeures sur ses avancées en matière d’intelligence artificielle. Il s’agira d’une conférence virtuelle, avec de rares invités sur place.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !

Cammile Bussière

One of the most important things for me as a press writer is the technical news that changes our world day by day, so I write in this area of technology across many sites and I am.

Recent Posts

Nick Clegg de Meta critique le pessimisme de Rishi Sunak en matière d’IA – POLITICO

En novembre dernier, le Royaume-Uni a accueilli des dirigeants mondiaux et des dirigeants du secteur technologique pour un sommet à…

2 minutes ago

L’Union européenne annonce un prêt de 35 milliards d’euros à Kyiv, financé par des avoirs russes gelés

Deux ans après le début de la guerre à grande échelle, la dynamique du soutien occidental à Kiev ralentit :…

4 minutes ago

Attaque au couteau à Rotterdam : un homme attaque plusieurs personnes dans la rue, l’une d’elles mortellement

Ce jeudi 19 septembre 2024, un homme a attaqué plusieurs personnes au couteau à Rotterdam, aux Pays-Bas. Bilan : un…

5 minutes ago

Une souris saute d’un plateau-repas en plein vol, l’avion fait demi-tour

l'essentiel Un avion reliant Oslo, en Norvège, à Malaga, en Espagne, a dû faire demi-tour après qu'une passagère a ouvert…

6 minutes ago

Le début incroyable de la France

La Ligue des champions a fait son retour cette semaine. Cette C1 au nouveau format a ouvert le bal avec,…

7 minutes ago

Colin Farrell confirme qu’il portait une prothèse (SPOILERS)

Le premier épisode du « Pingouin » voit Oswald Cobblepot se faire torturer entièrement nu par sa principale rivale, Sofia…

8 minutes ago