Mistral AI annonce la mise à disposition de Le Chat, son chatbot à intelligence artificielle, à tous. Alors qu’il fallait auparavant télécharger près de 24 Go de données via torrent pour utiliser Pixtral, la firme les a désormais compilées dans son service web.
La première IA multimodale de Mistral AI en version web
Similaire à ChatGPT ou Google Gemini, Le Chat est disponible en version web. Jusqu’à présent, il permettait de dialoguer avec les modèles de langage IA Mistral Nemo, Codestral et Mistral Large 2. Cette nouvelle version permet un accès gratuit à Pixtral 12-B, le premier modèle IA multimodal de Mistral.
En d’autres termes, une langue multimodale implique sa capacité à traiter différents formats de données : pour cette langue, il s’agit de la capacité à analyser des textes et des images.
Selon les benchmarks publiés par Mistral AI, la startup se targue d’égaler et parfois même de surpasser certains modèles plus grands, comme le LLaVA-OV 7B.
Essai de Pixtral : générer du code HTML à partir d’un croquis
Nous avons voulu tester les capacités du langage Pixtral 12-B présenté par Mistral AI. L’entreprise affirme que son langage peut générer du code informatique à partir d’un diagramme dessiné à la main. Nous avons donc esquissé une page Web sur un iPad en utilisant l’application Procreate avec un Apple Pencil.
En envoyant cette image à Pixtral, nous lui avons associé cette invite : « Écrivez le code HTML pour créer un site comme celui-ci. » Le Chat s’exécute et génère un code source au format HTML.
Curieux, nous nous sommes précipités pour visionner le code HTML en version navigateur.
Même si le résultat peut paraître un peu brouillon, la reconnaissance optique de l’écriture manuscrite est très efficace. La mise en page est globalement respectée, à l’exception des créneaux d’actualité qui ne sont pas positionnés comme sur le croquis.