Gemini Live arrive en France : un pas de plus vers la mort de Google Assistant
Google a déployé Gemini Live en France et en français ce jeudi 3 octobre. La fonctionnalité n’est plus réservée aux smartphones Pixel, mais est disponible sur tous les modèles Android. Ce nouveau type d’assistant vocal sera bientôt déployé sur iOS.
Gemini Live est disponible dans les pays anglophones depuis la sortie du Pixel 9, le dernier smartphone de Google. Cet assistant vocal d’un nouveau genre, capable de parler couramment, parle parfaitement le français… malgré son indisponibilité en France. Il faut passer son smartphone en anglais pour l’activer, puis lui parler en français.
Jeudi 3 octobre, Google a annoncé la fin de cette différenciation : Gemini Live est désormais disponible en France, avec un support natif français. C’est le rival du nouveau ChatGPT Voice Advanced, actuellement bloqué dans l’Union européenne.
Un assistant vocal bien plus puissant que Google Assistant
Depuis l’annonce d’Assistant avec Bard il y a presque un an (deux mois avant l’annonce de Gemini), la mort programmée de Google Assistant semble inévitable. Google fusionne progressivement ces deux assistants vocaux, pour permettre à Gemini, qui repose sur un LLM (large language model), d’effectuer des actions classiques (comme un minuteur ou un appel).
Avec Gemini Live, l’entreprise va encore plus loin. On peut discuter d’une manière » naturel » avec le chatbot Google, gratuitement.
BFM Tech&Co a pu tester la fonctionnalité, qui permet de choisir parmi dix voix (cinq féminines et cinq masculines). L’application Gemini voit apparaître une icône en bas à droite de l’écran pour démarrer l’interaction avec le chatbot, comme s’il s’agissait d’un appel vocal. On peut donc discuter avec lui, lui poser des questions, l’interrompre, lui demander des précisions, comme si on écrivait au Gémeaux. Il s’agit de la même interface que dans la version anglaise qui, rappelons-le, parlait déjà français.
Françoise Beaufays, chercheuse chez Google en charge du machine learning pour les modèles vocaux, interrogée par nos confrères, précise que « Le modèle de base est multilingue et optimisé pour les langues présentées aux utilisateurs. Tout est adapté au français : la reconnaissance vocale, le modèle, les réponses qu’elle produit et évidemment les voix « . Il est même possible de changer de langue à la volée. A terme, il devrait être possible de demander à Gemini Live d’analyser des documents et des photos, comme c’est le cas pour la version actuellement écrite. A l’issue d’une discussion, écrit Gemini un résumé de la discussion que vous avez eue avec lui.
Gemini Live est en cours de déploiement sur les smartphones Android, mais c’est une opération qui prendra plusieurs semaines, comme l’a indiqué Google. Si vous n’avez pas encore accès à la fonctionnalité, c’est tout à fait normal : attendez.
La guerre des chatbots vocaux est lancée
Parallèlement, OpenAI a lancé il y a quelques jours le nouveau mode vocal de ChatGPT, Voice Advanced, basé sur GPT-4o. Il n’est toujours pas disponible en France, mais peut être testé via un VPN en se localisant virtuellement aux Etats-Unis. Il offre également de grandes capacités d’expression orale, avec de l’émotion dans sa voix et la capacité de comprendre vos intonations.
Le 1er octobre, Microsoft a également annoncé tout un tas de nouveautés pour son chatbot, Copilot, basé sur GPT. Parmi eux, Copilot Voice, qui vise à faciliter « interagir avec votre compagnon IA « . Microsoft utilise la même technologie qu’OpenAI pour réinventer les conversations vocales, avec le pari que vous allez bientôt « téléphoner » à son assistant vocal pendant des heures.
OpenAI, Google et Microsoft se positionnent sur les interactions vocales avec des chatbots basés sur des LLM, tandis qu’Apple peaufine son nouveau Siri (avec également un LLM, mais avec des tâches dédiées). L’avenir de l’IA pourrait passer par l’avènement de ces nouveaux assistants vocaux.