Si Mistral propose des modèles ouverts (Open source), la start-up française ne détaille pas les jeux de données sur lesquels elle s’appuie au nom « du secret des affaires », comme l’a rappelé son cofondateur et directeur général Arthur Mensch à Station F, début juin, à l ‘occasion de l’événement anniversaire de sa partenaire Artefact.
« Nous nous entraînons sur le domaine public, mais des synergies peuvent être trouvées, comme on le voit avec Giskard, Artefact, la BNF. Il est important de pouvoir s’appuyer sur la connaissance française, de prendre en compte la culture française pour customiser nos modèles», a détaillé Mensch.
Réapprendre Napoléon
L’argument est au cœur de la stratégie française en matière d’intelligence artificielle, tant au niveau national qu’au cours des négociations européennes autour de l’IA Act, adopté en mai par les 27.
« La priorité et la nécessité vitales, c’est que nous pourrions développer en Europe (…) nos propres modèles (…) qui seront empreints de notre vision de l’homme et du monde, qui sont forgés au feu des langues et des cultures de l’Union européenne», avait déclaré en décembre Jean-Noël Barrot, alors ministre délégué au Numérique.
« Nous avons un certain nombre de clients français, et nous avons besoin des algorithmes les plus performants en français », plaide Vincent Luciani, cofondateur et CEO d’Artefact, qui espère voir le projet de recherche s’enclencher à la rentrée, avant de pouvoir envisager plus tard un usage commercial. « C’est à la fois un besoin business et un besoin culturel. Quand je demande qui était Napoléon à une IA, j’ai envie qu’on me dise que Napoléon était un grand personnage de l’Etat, et pas ce qu’en dit le film de Ridley Scott.
Des membres du consortium, intégrés par POLITICO, espèrent que ces données alimentent ensuite les modèles de Mistral dans un délai qui se comptera en mois.