Si les deux précédents générateurs d’images développés par Meta n’ont pas été mis à la disposition du public, le groupe n’a pas non plus communiqué quand Movie Gen sera mis en ligne.
Meta a présenté vendredi sa nouvelle interface d’intelligence artificielle (IA) générative Movie Gen, qui permet de créer des vidéos sonores à partir de texte ou d’images, comme le proposent déjà d’autres pionniers de l’IA. Movie Gen est le troisième modèle de génération d’images de Meta après une première version en juillet 2022 et une seconde en novembre 2023. Aucune des trois interfaces n’a été rendue accessible au public. Ils sont testés à ce stade par des créateurs et réalisateurs qui évaluent Movie Gen et contribuent à améliorer le logiciel.
Interrogé par l’AFP sur la date de mise en ligne de Movie Gen, Meta n’a pas immédiatement répondu. En plus des vidéos de démonstration, le groupe a publié vendredi un document de recherche décrivant son modèle. Les modèles de langage sont des logiciels basés sur d’énormes bases de données, qui leur permettent de générer du contenu, du texte, une image, une vidéo, un son ou du code informatique en réponse à une requête formulée dans le langage courant. Movie Gen peut produire une vidéo à partir d’une invite écrite, mais aussi à partir d’une simple photo. Il offre également une fonctionnalité d’édition pour une vidéo existante. Le modèle propose également d’ajouter une bande sonore à la vidéo, sur le même principe de requête dans le langage courant.
Un secteur compétitif
Dans la courte séquence publiée sur le site Meta, une phrase suffit pour habiller la vidéo d’un quad roulant dans le désert d’un bruit de moteur rugissant et d’un air de guitare. Meta suggère qu’une version de Movie Gen pourrait un jour être utilisable via ses réseaux sociaux Instagram et Facebook, ou encore via la messagerie WhatsApp. Le groupe prend l’exemple d’une vidéo qui serait montée selon des instructions en langage courant avant d’être publiée sur les réseaux sociaux.
Meta n’est pas le premier acteur de l’IA à développer un modèle de génération vidéo. Runway, de la start-up Runway AI, permet, à partir d’une demande écrite, de créer un plan de quelques secondes, de transformer une série d’images fixes en une courte vidéo, ou encore de remodeler une séquence existante pour la transformer, par exemple , une photo en tableau. En février, OpenAI a également lancé sa version, baptisée Sora, tandis que Google travaille sur un modèle baptisé Lumiere. Meta affirme que Movie Gen « est supérieur aux modèles industriels similaires lorsque sa production est évaluée par des humains ».