Microsoft aurait développé un outil de synthèse vocale basé sur l’IA qui est si réaliste qu’il hésite à le rendre disponible…
Il s’agit d’une amélioration du premier modèle du genre, VALL-E, présenté par Microsoft en janvier 2023, qui était capable d’imiter n’importe quelle voix à partir d’un extrait d’à peine 3 secondes. À l’époque, même si le produit était déjà une prouesse, il affichait quelques imperfections dans le rendu qui permettaient tout de même de repérer son caractère artificiel. Ce qui ne serait plus le cas aujourd’hui.
Bien sûr, il faudra prendre au mot Microsoft les performances de VALL-E 2, le géant ayant décidé de ne pas le proposer au public pour des raisons de sécurité. D’une certaine manière, c’est dommage quand on sait que le géant américain affirme que » VALL-E 2 synthétise systématiquement une parole de haute qualité, même pour les phrases traditionnellement difficiles à prononcer en raison de leur complexité ou de leur nature répétitive.. »
Mais c’est peut-être aussi pour le mieux, quand on se souvient des diverses escroqueries qui ont utilisé des IA de synthèse vocale pour voler de nombreuses personnes.