Sciences et technologies

Nous avons testé Pixtral, le nouveau modèle de Mistral AI et c’est impressionnant

Le modèle Pixtral est en ligne sur Le Chat

Le modèle Pixtral est en ligne sur Le Chat

© Mistral AI

Mistral AI annonce la mise à disposition de Le Chat, son chatbot à intelligence artificielle, à tous. Alors qu’il fallait auparavant télécharger près de 24 Go de données via torrent pour utiliser Pixtral, la firme les a désormais compilées dans son service web.

Publicité, votre contenu continue ci-dessous

La première IA multimodale de Mistral AI en version web

Similaire à ChatGPT ou Google Gemini, Le Chat est disponible en version web. Jusqu’à présent, il permettait de dialoguer avec les modèles de langage IA Mistral Nemo, Codestral et Mistral Large 2. Cette nouvelle version permet un accès gratuit à Pixtral 12-B, le premier modèle IA multimodal de Mistral.

Les modèles de chat Mistral

Modèles d’IA disponibles sur Le Chat

© Capture d’écran // Mistral

En d’autres termes, une langue multimodale implique sa capacité à traiter différents formats de données : pour cette langue, il s’agit de la capacité à analyser des textes et des images.

Références Pixtral

Tests de performance du Pixtral 12-B

© Mistral AI

Selon les benchmarks publiés par Mistral AI, la startup se targue d’égaler et parfois même de surpasser certains modèles plus grands, comme le LLaVA-OV 7B.

Essai de Pixtral : générer du code HTML à partir d’un croquis

Nous avons voulu tester les capacités du langage Pixtral 12-B présenté par Mistral AI. L’entreprise affirme que son langage peut générer du code informatique à partir d’un diagramme dessiné à la main. Nous avons donc esquissé une page Web sur un iPad en utilisant l’application Procreate avec un Apple Pencil.

Test du code pixel 12B Mistral AI

Un croquis à main levée d’une page Web

© Florent LANNE pour Les Numériques

En envoyant cette image à Pixtral, nous lui avons associé cette invite : « Écrivez le code HTML pour créer un site comme celui-ci. » Le Chat s’exécute et génère un code source au format HTML.

HTML Pixtral 12B

Pixtral 12B génère du code HTML à partir d’une image

© Florent LANNE pour Les Numériques

Curieux, nous nous sommes précipités pour visionner le code HTML en version navigateur.

Mistral AI Pixtral HTML

La page Web HTML générée par Pixtral 12-B avec Le Chat

© Florent LANNE pour Les Numériques

Même si le résultat peut paraître un peu brouillon, la reconnaissance optique de l’écriture manuscrite est très efficace. La mise en page est globalement respectée, à l’exception des créneaux d’actualité qui ne sont pas positionnés comme sur le croquis.

Publicité, votre contenu continue ci-dessous

Jewel Beaujolie

I am a fashion designer in the past and I currently write in the fields of fashion, cosmetics, body care and women in general. I am interested in family matters and everything related to maternal, child and family health.
Bouton retour en haut de la page