Sciences et technologies

Google réintroduit la génération d’images de personnes réalistes

Google s’excuse et relance Gemini avec une fonctionnalité de génération d’images améliorée.

Google fait son retour sur la scène de la génération d’images par l’IA.

Après avoir suspendu cette fonctionnalité de Gemini en février dernier suite à une série de polémiques, le géant de la technologie annonce une mise à jour majeure.

Au menu : des images plus réalistes, une meilleure gestion de la diversité et des garde-fous éthiques renforcés.

Pour aller plus loin
Gemini : Tout ce qu’il faut savoir sur l’IA de Google qui veut remplacer ChatGPT

Un pas en avant, deux précautions

La principale nouveauté est l’arrivée deImage 3Le dernier modèle de génération d’images de Google.

Pour aller plus loin
Google va générer des images encore plus performantes pour concurrencer DALL-E et Midjourney

Présenté à l’I/O 2024, ce petit prodige promet la lune. Son atout ? La possibilité de créer des images photoréalistes de personnes à partir de simples descriptions textuelles. Fini les résultats bizarres qui ont tant fait parler, Google assure que cette fois, c’est du sérieux.

Mais ne vous attendez pas à pouvoir créer un croquis de votre voisin ou ressusciter numériquement des célébrités décédées. Google a mis tout en œuvre pour assurer sa sécurité. Exit le « des individus photoréalistes et identifiables« , des mineurs ou des scènes trop violentes ou sexuelles. L’entreprise joue la carte de la sécurité.

Google / Ars Technica

Dave Citron, le responsable de la gestion des produits chez Gemini, se veut rassurant : « Dans une large gamme de tests, l’image 3 se comporte favorablement par rapport aux autres modèles d’imagerieTraduction : nous avons travaillé dur pour éviter les bourdes du passé. Et pour enfoncer le clou, Google a même sorti son outil SynthID, histoire de marquer correctement les images générées par l’IA. Pas question de laisser planer le moindre doute.

Google / Ars Technica

L’histoire, un casse-tête pour l’IA

Souvenez-vous de la controverse du « inexactitudes historiques  » qui avait allumé la mèche. Gemini qui nous donnait des rois noirs d’Angleterre ou des nazis asiatiques, ça avait fait grincer bien des dents. Google l’assure : cette fois, on a mis le paquet pour éviter ce genre de faux pas.

Google réintroduit la génération d’images de personnes réalistes
Google / Ars Technica

L’entreprise a mis en place un arsenal pour détecter et bloquer les images problématiques. Un « classificateur multimodal » (comprenez : un logiciel ultra sophistiqué) se charge d’identifier les représentations potentiellement nuisibles. Le but ? Trouver le juste équilibre entre diversité et exactitude historique. Pas simple.

« Avec Imagen 3, nous avons réalisé des progrès significatifs pour offrir une meilleure expérience utilisateur lors de la génération d’images de personnes »

Google

Mais attention, prévient Google : l’image 3 ne sera pas parfaite. On peut s’attendre à quelques ratés ici et là. L’important est que l’on ne devrait plus voir de contenu véritablement choquant ou complètement décalé historiquement parlant. Du moins, c’est ce qu’on nous promet.

Un déploiement prudent et progressif

Ne vous attendez pas à pouvoir jouer avec Imagen 3 demain matin. Google a opté pour un déploiement en douceur. Initialement, seuls les abonnés Gemini Advanced (la version payante, donc) aura droit à ce nouveau jouet. Et pourtant, la génération d’images photoréalistes de personnes ne sera pas disponible tout de suite.

C’est une stratégie compréhensible. Google veut à tout prix éviter un nouveau bad buzz. En limitant l’accès et en recueillant les retours des premiers utilisateurs, l’entreprise espère peaufiner son outil avant un déploiement plus large.

En plus d’intégrer la nouvelle version d’Imagen dans Gemini, Google a annoncé que ses clients professionnels pourront commencer à créer des Gems, qui sont des versions personnalisées de Gemini pouvant être utilisées à diverses fins : développement de logiciels, coaching d’apprentissage ou éditeurs de rédaction.


Jewel Beaujolie

I am a fashion designer in the past and I currently write in the fields of fashion, cosmetics, body care and women in general. I am interested in family matters and everything related to maternal, child and family health.
Bouton retour en haut de la page