Gemini Live arrive en France : un pas de plus vers la mort de Google Assistant

Jewel Beaujolieoctobre 4, 2024

9 4 minutes de lecture

Gemini Live arrive en France : un pas de plus vers la mort de Google Assistant

Google a déployé Gemini Live en France et en français ce jeudi 3 octobre. La fonctionnalité n’est plus réservée aux smartphones Pixel, mais est disponible sur tous les modèles Android. Ce nouveau type d’assistant vocal sera bientôt déployé sur iOS.

Gemini Live est disponible dans les pays anglophones depuis la sortie du Pixel 9, le dernier smartphone de Google. Cet assistant vocal d’un nouveau genre, capable de parler couramment, parle parfaitement le français… malgré son indisponibilité en France. Il faut passer son smartphone en anglais pour l’activer, puis lui parler en français.

Jeudi 3 octobre, Google a annoncé la fin de cette différenciation : Gemini Live est désormais disponible en France, avec un support natif français. C’est le rival du nouveau ChatGPT Voice Advanced, actuellement bloqué dans l’Union européenne.

Un assistant vocal bien plus puissant que Google Assistant

Depuis l’annonce d’Assistant avec Bard il y a presque un an (deux mois avant l’annonce de Gemini), la mort programmée de Google Assistant semble inévitable. Google fusionne progressivement ces deux assistants vocaux, pour permettre à Gemini, qui repose sur un LLM (large language model), d’effectuer des actions classiques (comme un minuteur ou un appel).

Avec Gemini Live, l’entreprise va encore plus loin. On peut discuter d’une manière » naturel » avec le chatbot Google, gratuitement.

D’ailleurs, et c’est assez surprenant, Gemini Live parle parfaitement le français sans accent (contrairement à ChatGPT). Mais si vous ne passez pas le Pixel 9 en anglais, en supprimant le français dans les paramètres Gemini, cela ne fonctionne pas. pic.twitter.com/SKDKSxhvFn

-Nicolas Lellouche (@LelloucheNico) 21 août 2024

BFM Tech&Co a pu tester la fonctionnalité, qui permet de choisir parmi dix voix (cinq féminines et cinq masculines). L’application Gemini voit apparaître une icône en bas à droite de l’écran pour démarrer l’interaction avec le chatbot, comme s’il s’agissait d’un appel vocal. On peut donc discuter avec lui, lui poser des questions, l’interrompre, lui demander des précisions, comme si on écrivait au Gémeaux. Il s’agit de la même interface que dans la version anglaise qui, rappelons-le, parlait déjà français.

Françoise Beaufays, chercheuse chez Google en charge du machine learning pour les modèles vocaux, interrogée par nos confrères, précise que « Le modèle de base est multilingue et optimisé pour les langues présentées aux utilisateurs. Tout est adapté au français : la reconnaissance vocale, le modèle, les réponses qu’elle produit et évidemment les voix « . Il est même possible de changer de langue à la volée. A terme, il devrait être possible de demander à Gemini Live d’analyser des documents et des photos, comme c’est le cas pour la version actuellement écrite. A l’issue d’une discussion, écrit Gemini un résumé de la discussion que vous avez eue avec lui.

Étapes pour activer Gemini Live // Source : Google

Gemini Live est en cours de déploiement sur les smartphones Android, mais c’est une opération qui prendra plusieurs semaines, comme l’a indiqué Google. Si vous n’avez pas encore accès à la fonctionnalité, c’est tout à fait normal : attendez.

La guerre des chatbots vocaux est lancée

Parallèlement, OpenAI a lancé il y a quelques jours le nouveau mode vocal de ChatGPT, Voice Advanced, basé sur GPT-4o. Il n’est toujours pas disponible en France, mais peut être testé via un VPN en se localisant virtuellement aux Etats-Unis. Il offre également de grandes capacités d’expression orale, avec de l’émotion dans sa voix et la capacité de comprendre vos intonations.

@numerama

Nous avons essayé le nouveau ChatGPT en français avec le mode « Voice Advanced » : c’est aussi hilarant qu’effrayant 😂 Vous allez adorer le voir rapper, nous crier dessus comme un pirate… ou parler français avec un accent espagnol 😬 #numerama #chatgpt # chatgptvoice #humour #tech #technologie #techtok

♬ son original – Numerama – Numerama

Le 1er octobre, Microsoft a également annoncé tout un tas de nouveautés pour son chatbot, Copilot, basé sur GPT. Parmi eux, Copilot Voice, qui vise à faciliter « interagir avec votre compagnon IA « . Microsoft utilise la même technologie qu’OpenAI pour réinventer les conversations vocales, avec le pari que vous allez bientôt « téléphoner » à son assistant vocal pendant des heures.

Une démonstration de Copilot Voice // Source : Microsoft

OpenAI, Google et Microsoft se positionnent sur les interactions vocales avec des chatbots basés sur des LLM, tandis qu’Apple peaufine son nouveau Siri (avec également un LLM, mais avec des tâches dédiées). L’avenir de l’IA pourrait passer par l’avènement de ces nouveaux assistants vocaux.