Bientôt la fin de la traversée du désert pour les Gémeaux ? Le dernier modèle impressionne sur les benchmarks

1 Temps de lecture 1 minute

Bientôt la fin de la traversée du désert pour les Gémeaux ? Le dernier modèle impressionne sur les benchmarks

Google a clairement travaillé sur la concision de ses réponses. Ce nouveau modèle Gemini produit des textes 5 à 20 % plus courts, répondant aux critiques sur la verbosité des versions précédentes. Une démarche qui fait preuve d’une écoute attentive aux retours des utilisateurs. En confrontations directes, Gemini-Exp-1114 affiche des taux de victoire impressionnants : 50% contre GPT-4o, 56% contre le modèle o1-preview et 62% contre Claude 3.5 Sonnet. Des chiffres qui traduisent une montée en puissance indéniable et repositionnent Google comme un acteur majeur. En revanche, le code reste un de ses angles morts, et c’est l’o1-preview qui domine encore dans ce domaine.

Google semble donc revenir dans la course, et c’est une bonne chose. Rappelons que de nombreuses rumeurs font état d’une possible intégration de Gemini dans l’écosystème IA d’Apple, à l’image du partenariat que la société de Cupertino entretient avec OpenAI.

Jewel Beaujolieil y a 2 heures

1 Temps de lecture 1 minute