En six mois seulement, une poignée de chercheurs français ont réussi l’impossible : créer un assistant vocal capable de rivaliser avec les géants américains. Moshi, le petit prodige de Kyutai, promet des conversations fluides et naturelles comme jamais auparavant. Un tour de force qui pourrait bien rebattre les cartes de l’IA mondiale.
Oubliez tout ce que vous pensiez savoir sur les assistants vocaux. Moshi, la nouvelle IA de Kyutaivient de changer les règles du jeu. Plus rapide que ChatGPT, plus naturel que Siri, cet assistant vocal français pourrait bien révolutionner notre façon d’interagir avec l’intelligence artificielle. La conférence a lieu aujourd’hui, 3 juillet, et vous pouvez la revoir en ligne.
Une IA qui parle plus vite que son ombre
Le chiffre est impressionnant : 160 millisecondes. C’est le temps de latence annoncé par Moshi, un record du secteur. Pour vous donner une idée, c’est plus rapide que le temps qu’il vous faut pour cligner des yeux. Cette réactivité fulgurante permet des conversations d’une fluidité sans précédent, comme si vous parliez à un véritable être humain.
Mais la rapidité n’est pas le seul atout de Moshi. Contrairement à d’autres assistants vocaux qui convertissent la voix en texte avant de répondre, Moshi traite directement le son. Le résultat ? Il peut reconnaître et imiter jusqu’à 70 émotions différentesIl s’agit d’une IA capable de chuchoter, de plaisanter ou encore d’adopter l’accent de votre choix. L’équipe a également relevé le défi de la latence, parvenant à la réduire à seulement 200 millisecondes. Un temps de réponse remarquablement proche de celui d’une conversation humaine, rendant les échanges avec Moshi étonnamment naturels. C’est la promesse de Moshi.
Enfin, Kyutai a optimisé le code et réduit la taille des modèles, permettant à Moshi de fonctionner localement sur des appareils comme un MacBook Pro. Cette prouesse technique ouvre la voie à une utilisation plus large et plus privée de l’assistant vocal, sans dépendance constante à une connexion Internet.
L’Europe dans la course à l’IA
Derrière Moshi se cache Kyutai, un laboratoire co-fondé par Xavier Niel Avec un objectif ambitieux : empêcher la fuite des cerveaux européens vers les États-Unis ou la Chine. En seulement six mois, une équipe de huit chercheurs est parvenue à mettre au point cette IA révolutionnaire. Un véritable tour de force qui démontre que l’Europe a toutes les cartes en main pour rivaliser avec les géants de la Silicon Valley.
Mais Kyutai va au-delà de la simple compétition technologique. En choisissant une approche open source, le laboratoire souhaite démocratiser l’accès à une IA de pointe. Malgré ses prouesses, Moshi n’est pas exempt de défauts. Pour l’instant, l’assistant ne parle qu’anglais, un choix stratégique pour toucher rapidement un public plus large. De plus, son modèle linguistique Héliumavec ses 7 milliards de paramètres, reste modeste face à des mastodontes comme GPT-4. Ce dernier compte 175 milliards de paramètres.
La question de la vie privée se pose également. Moshi a été formé sur des enregistrements d’appels téléphoniques datant des années 1990. Même si ces données sont anciennes, on peut s’interroger sur les implications éthiques d’une telle pratique.
Quoi qu’il en soit, Moshi frappe fort dans un domaine qui fait actuellement la une des journaux : la voix. L’assistant vocal pourrait réellement comprendre le ton de votre voix, réagir à votre humeur et vous répondre de manière parfaitement naturelle. Le lancement de Moshi est un signal fort pour l’industrie de l’IA en Europe. Il montre qu’avec les bons investissements et une vision claire, le Vieux Continent peut non seulement rattraper son retard, mais aussi innover de manière significative.
Mais le véritable test pour Moshi et Kyutai commence maintenant. L’assistant sera bientôt disponible sous forme de prototype pour le grand public sur le site officiel. Nous avons hâte de tester ses capacités.
Envie de rejoindre une communauté de passionnés ? Notre Discord vous accueille, c’est un lieu d’entraide et de passion autour de la tech.