Près de trois mois après le lancement de GPT-4o, les fonctions vocales de ChatGPT sont enfin activées. Les internautes ont publié un certain nombre de vidéos sur les réseaux sociaux montrant de quoi il est capable, ainsi que certaines de ses particularités.
OpenAI vient d’activer les fonctionnalités vocales de son modèle GPT-4o pour un petit nombre d’abonnés ChatGPT PlusChatGPT Plus et certains internautes chanceux n’ont pas hésité à tester ses limites. Cette nouvelle fonctionnalité était très attendue depuis son annonce en mai dernier.
Parmi les différentes vidéos publiées sur le réseaux sociauxréseaux sociauxon retrouve notamment un test rapide de ses capacités en français, espagnol et ourdou. Si le chatbot est compréhensible, l’accent est… discutable. GPT-4o peut faire le Commentateur sportifou imiter une personne qui parler en pleurantmais ne sait pas imiter un chat. Mais le plus étonnant, c’est que lorsqu’il compte rapidement jusqu’à 50, ChatGPT s’arrête pour reprendre son souffle.
Fonctionnalité vocale ouverte à tous les abonnés à l’automne
Cela a donné lieu à l’une des vidéos les plus étranges publiées sur le subreddit r/singularity, où le modèle GPT-4o prétend avoir besoin de respirer. L’utilisateur lui demande d’enchaîner des virelangues (des phrases difficiles à prononcer) et le chatbot s’exécute sans difficulté. Cependant, l’homme lui demande ensuite de le faire sans s’arrêter ni respirer.IAIA refuse catégoriquement. J’aurais aimé, mais j’ai besoin de respirer, comme toute personne qui parle. » ChatGPT répond, et invite son interlocuteur à l’essayer lui-même. Le modèle a été entraîné sur un très grand nombre de clips audio d’humains parlant et a apparemment pleinement intégré les inspirations dans son imitation de la parole humaine.
OpenAI dit travailler avec plus d’une centaine de testeurs qui parlent 45 langues, donc on espère qu’il sera bientôt capable de parler d’autres langues que l’anglais sans accent américain. Davantage d’abonnés à ChatGPT Plus devraient pouvoir y accéder dans les semaines à venir, et la fonctionnalité devrait être ouverte à tous les abonnés àautomneautomne.