Ce nouveau modèle d’IA générative peut « raisonner » en temps réel via l’audio, la vision et le texte. Ces nouvelles fonctionnalités seront progressivement ajoutées à ChatGPT, en commençant par le texte et l’image.
Publié
Temps de lecture : 2 minutes
La révolution de l’IA continue. OpenAI, l’éditeur de ChatGPT, a présenté lundi 13 mai son nouveau modèle d’intelligence artificielle générative, GPT-4o, destiné à offrir à tous ses utilisateurs ses capacités les plus avancées en matière de production et de compréhension de textes, d’images et de sons. et la voix. « Nous sommes vraiment ravis de proposer GPT-4o à tous nos utilisateurs gratuits. Les utilisateurs payants continueront de bénéficier de limites d’utilisation cinq fois plus élevées que les utilisateurs gratuits. »a déclaré Mira Murati, directrice technologique de la start-up californienne, lors d’une présentation vidéo en direct.
« Mais c’est la première fois que nous faisons un grand pas en avant en matière de facilité d’utilisation. C’est extrêmement important, il s’agit de l’avenir de l’interaction entre nous et les machines. », elle a ajouté. OpenAI a dévoilé un nouveau modèle, GPT-4o (« o » pour « omni »), qui peut « raison » en temps réel via l’audio, la vision et le texte. Ces nouvelles fonctionnalités seront progressivement ajoutées à ChatGPT, en commençant par le texte et l’image, initialement pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites d’utilisation. La nouvelle version du « Voice Mode » devrait arriver dans les prochaines semaines pour les abonnés.
Avec deux de ses collègues, Mira Murati a démontré comment les utilisateurs pourront interagir avec ChatGPT, lors de conversations fluides, reproduisant de manière étonnante les discussions entre humains. En mode vocal, ChatGPT est capable de lire les émotions des utilisateurs sur les visages via la caméra d’un smartphone, de les guider pour faire des exercices de respiration, de leur raconter une histoire ou encore de les aider à résoudre un problème de mathématiques. Et les utilisateurs peuvent facilement l’interrompre.
« Tu as l’air heureux. (…) Veux-tu me dire quelle est la source de toute cette bonne humeur ? »a demandé la machine à un ingénieur OpenAI, qui a répondu qu’il montrait au public comment elle fonctionnait « utile et fabuleux ». « Oh arrête, tu me fais rougir. », s’est-elle exclamée en retour. Fin 2022, avec le lancement de ChatGPT, OpenAI mettait sur les rails l’IA générative, une révolution qui a surpris tous les géants de la technologie.