Avant les vacances, Microsoft a annoncé qu’il mettait à niveau le modèle d’IA derrière Bing Image Creator, l’outil d’édition d’images alimenté par l’IA intégré au moteur de recherche Bing de l’entreprise. Microsoft a promis que le nouveau modèle – la dernière version du modèle DALL-E 3 d’OpenAI, nommé PR16 – permettrait aux utilisateurs de créer des images « deux fois plus vite qu’avant » avec « une qualité supérieure ».
Mais cela n’a pas fonctionné. Les plaintes ont rapidement inondé X et Reddit.
« Le DALL-E que nous aimions a disparu pour toujours », a déclaré un utilisateur de Reddit. « J’utilise ChatGPT maintenant parce que Bing est devenu inutile pour moi », a écrit un autre.
Le retour de flamme a été tel que Microsoft a annoncé qu’il restaurerait le modèle précédent sur Bing Image Creator jusqu’à ce qu’il puisse résoudre les problèmes.
ramenez l’ancienne dalle 3 ! la qualité d’image est bien meilleure sur l’ancien modèle. comme ces images par exemple. l’image générée par le nouveau modèle est nul 🙁 pic.twitter.com/BjIM8MS4ng
– ze ᡣ𐭩ྀིྀི (@riegrowl) 28 décembre 2024
« Nous avons pu (reproduire) certains des problèmes signalés et prévoyons de revenir à (DALL-E 3) PR13 jusqu’à ce que nous puissions les résoudre », a déclaré Jordi Ribas, responsable de la recherche chez Microsoft, dans un article sur X. Mardi soir. « Le processus de déploiement est malheureusement très lent. Cela a commencé il y a plus d’une semaine et il faudra encore 2 à 3 semaines pour atteindre 100 %.
Alors, qu’est-ce qui n’a pas fonctionné ?
Il est difficile de comparer les résultats des modèles à partir de rapports anecdotiques, en particulier lorsque les invites ne sont pas standardisées. Mais de nombreux utilisateurs ont déclaré que le PR16 avait tendance à rendre les images moins réalistes. Mayank Parmar, écrivant pour Windows Latest, a noté que les images générées par PR16 manquaient de détails et de finition, et semblaient étrangement caricaturales et « sans vie ».
Je ne sais pas de qui tu te moques avec ça. DALL-E est objectivement pire qu’il ne l’a jamais été après cette « mise à jour » et vous êtes devancé par d’autres sociétés comme Google. C’est absolument le jour et la nuit que l’on compare la qualité d’image d’aujourd’hui à celle d’il y a seulement quelques mois. pic.twitter.com/EdSdk7aign
– vers l’extérieur (@roccynoxy) 19 décembre 2024
Ce n’est pas la première fois qu’un modèle d’image qui aurait réussi les contrôles internes n’est pas bien accueilli publiquement. En février dernier, Google a été contraint de suspendre la capacité de son chatbot IA Gemini à créer des images de personnes après que des utilisateurs se soient plaints d’inexactitudes historiques.
Ces faux pas illustrent à quel point il peut être difficile de mesurer les améliorations d’un modèle dans le monde réel. Selon Ribas, l’analyse comparative de Microsoft a révélé que la qualité du PR16 était « un peu meilleure en moyenne » par rapport au modèle précédent de Bing Image Creator.
Quelle que soit la mesure interne utilisée par l’entreprise, il semble clair qu’elle ne correspond pas aux préférences de la plupart des gens.
TechCrunch propose une newsletter axée sur l’IA ! Inscrivez-vous ici pour le recevoir dans votre boîte de réception tous les mercredis.