Les nouvelles les plus importantes de la journée

Nous avons testé Pixtral, le nouveau modèle de Mistral AI et c’est impressionnant

Nous avons testé Pixtral, le nouveau modèle de Mistral AI et c’est impressionnant

Le modèle Pixtral est en ligne sur Le Chat

Le modèle Pixtral est en ligne sur Le Chat

© Mistral AI

Mistral AI annonce la mise à disposition de Le Chat, son chatbot à intelligence artificielle, à tous. Alors qu’il fallait auparavant télécharger près de 24 Go de données via torrent pour utiliser Pixtral, la firme les a désormais compilées dans son service web.

Publicité, votre contenu continue ci-dessous

La première IA multimodale de Mistral AI en version web

Similaire à ChatGPT ou Google Gemini, Le Chat est disponible en version web. Jusqu’à présent, il permettait de dialoguer avec les modèles de langage IA Mistral Nemo, Codestral et Mistral Large 2. Cette nouvelle version permet un accès gratuit à Pixtral 12-B, le premier modèle IA multimodal de Mistral.

Modèles d’IA disponibles sur Le Chat

© Capture d’écran // Mistral

En d’autres termes, une langue multimodale implique sa capacité à traiter différents formats de données : pour cette langue, il s’agit de la capacité à analyser des textes et des images.

Tests de performance du Pixtral 12-B

© Mistral AI

Selon les benchmarks publiés par Mistral AI, la startup se targue d’égaler et parfois même de surpasser certains modèles plus grands, comme le LLaVA-OV 7B.

Essai de Pixtral : générer du code HTML à partir d’un croquis

Nous avons voulu tester les capacités du langage Pixtral 12-B présenté par Mistral AI. L’entreprise affirme que son langage peut générer du code informatique à partir d’un diagramme dessiné à la main. Nous avons donc esquissé une page Web sur un iPad en utilisant l’application Procreate avec un Apple Pencil.

Un croquis à main levée d’une page Web

© Florent LANNE pour Les Numériques

En envoyant cette image à Pixtral, nous lui avons associé cette invite : « Écrivez le code HTML pour créer un site comme celui-ci. » Le Chat s’exécute et génère un code source au format HTML.

Pixtral 12B génère du code HTML à partir d’une image

© Florent LANNE pour Les Numériques

Curieux, nous nous sommes précipités pour visionner le code HTML en version navigateur.

La page Web HTML générée par Pixtral 12-B avec Le Chat

© Florent LANNE pour Les Numériques

Même si le résultat peut paraître un peu brouillon, la reconnaissance optique de l’écriture manuscrite est très efficace. La mise en page est globalement respectée, à l’exception des créneaux d’actualité qui ne sont pas positionnés comme sur le croquis.

Publicité, votre contenu continue ci-dessous
Quitter la version mobile