09:44
Les employés d'OpenAI ont publiquement accusé les résultats des tests de benchmark du dernier modèle d'IA, Grok3, d'être trompeurs.
Les employés d'OpenAI ont accusé xAI de publier des résultats de tests de benchmark du modèle d'intelligence artificielle Grok3 trompeurs, mais xAI a nié tout comportement inapproprié. Grok3 a surpassé le modèle le plus puissant d'OpenAI à l'AIME 2025, mais il a été noté que le graphique ne contenait pas toutes les données de comparaison. Babushkin a fait valoir qu'OpenAI avait également publié des graphiques similaires par le passé pour comparer les performances des modèles.
- 1