Meta lance Llama 3.1, un modèle d’IA open source aussi puissant que GPT-4o

Ray Richard

il y a 4 mois

Meta lance Llama 3.1, un modèle d’IA open source aussi puissant que GPT-4o

Le nouveau modèle de langage majeur de Meta, Llama 3.1, veut concurrencer les grands noms de l’industrie, GPT-4o et Claude 3.5 Sonnet. Et il a un atout dans sa manche pour remporter le pari : le modèle est open source, il est donc disponible gratuitement pour tous.

» L’intelligence artificielle open source est bénéfique pour le monde » déclare Mark Zuckerberg. Fort de cette conviction, le fondateur et patron de Méta a annoncé la distribution gratuite et ouverte de Lama 3.1la nouvelle version « enrichie » du grand modèle de langage (LLM) développé par la société. Il en existe trois, en fait : un modèle 8B (pour 8 milliards de paramètres), 70B (70 milliards) et le plus robuste de tous, 405B (405 milliards).

Un tacle contre Apple et son modèle fermé

Le nombre de paramètres est un gage de capacité du modèle, il n’est pas le seul à prendre en compte (la qualité des données d’entraînement est tout aussi essentielle). Mais Meta veut faire un carton face à la concurrence très affûtée d’OpenAI (GPT-4o) et d’Anthropic (Claude 3.5 Sonnet), et s’en est donc donné les moyens en entraînant Llama 3.1 sur 16 000 GPU Nvidia H100, rien que ça.

Malgré les coûts liés à la formation du LLM, Meta le « donne » donc à la communauté. Mark Zuckerberg est convaincu que les modèles d’IA ouverts dépasseront les modèles propriétaires, de la même manière que Linux est devenu la base sur laquelle repose l’industrie du cloud computing et également le système d’exploitation qui fait fonctionner la majorité des appareils mobiles.

Alors qu’il reste à voir ce que l’humanité va tirer de Llama, quel est l’intérêt de Meta ? Mark Zuckerberg se souvient des déboires de son entreprise avec Apple :

« L’une de mes expériences formatrices a été de développer nos services sous les contraintes imposées par Apple à ses plateformes. Entre la façon dont ils taxent les développeurs, les règles arbitraires qu’ils appliquent et toutes les innovations de produits qu’ils bloquent, il est clair que Meta et de nombreuses autres entreprises devraient être libres d’offrir de bien meilleurs services aux utilisateurs si nous pouvions créer les meilleures versions de nos produits sans que nos concurrents ne puissent restreindre ce que nous pouvons créer. »

Pour éviter de se retrouver enfermé dans un écosystème fermé, Llama doit devenir un écosystème complet avec des outils, des gains d’efficacité, des optimisations de silicium et d’autres intégrations que seul l’open source peut fournir. De plus, vendre l’accès aux modèles d’IA ne fait pas partie du modèle économique de Meta : publier Llama en open source ne nuit pas aux revenus ni à la capacité d’investir dans la recherche.

C’est aussi un juste retour des choses, sachant que Meta a » Des milliards économisés » grâce à des projets comme Open Compute Project et a bénéficié des innovations de l’écosystème en publiant des outils comme PyTorch et React. Meta n’a pas attendu le 23 juillet pour commencer à battre le tambour : 25 partenaires sont dans la boucle, parmi lesquels Nvidia, Amazon Web Services, Google Cloud, SNCF Gares & Connexions et d’autres.

SNCF Gares & Connexions expérimente avec Llama 3.1 de nouvelles fonctionnalités dont le multilinguisme pour l’information et l’orientation des voyageurs en gare en français, anglais, allemand, espagnol, italien et portugais. Pour renforcer le dispositif, une expérience rapide et personnalisée est également accessible via un chatbot WhatsApp, qui fournit des informations en temps réel aux voyageurs, par exemple sur leurs déplacements en gare.

Si Meta joue volontiers la carte de la transparence pour promouvoir les capacités de son nouveau LLM, il reste discret sur la question de l’information sur les données de formation, considérées comme un secret industriel. Meta explique simplement qu’il utilise » données synthétiques » généré par un modèle plutôt que par des humains. Comment éviter les poursuites judiciaires pour pillage ? Rien n’est moins sûr.

Dans la foulée, l’entreprise a également lancé une version multilingue de son assistant Meta AI, désormais disponible dans 22 nouveaux pays. Le service, intégré aux applications WhatsApp, Instagram, Messenger et Facebook, parle désormais le français, l’allemand, l’espagnol et le portugais. Il n’est toutefois pas encore disponible dans l’Union européenne et il semble peu probable que cela arrive dans un avenir proche.

L’Europe sera privée d’assistant Meta AI, du moins pour l’instant

🔴 Pour ne rien manquer de l’actualité de 01net, suivez-nous sur Google News et WhatsApp.

Source :

Méta