Сотрудники OpenAI публично обвинили XAI в том, что результаты тестирования модели искусственного интеллекта Grok3 имеют вводящие в заблуждение Бенчмарк
Сотрудники OpenAI обвинили xAI в том, что результаты тестирования модели искусственного интеллекта Grok3, опубликованные xAI, вводят в заблуждение, но xAI отрицает неправомерное поведение. Grok3 превзошел самую мощную модель OpenAI на AIME 2025, но ему было указано, что график не содержит всех сравнительных данных. Баббушкин отметил, что OpenAI ранее также публиковал подобные графики для сравнения производительности моделей.
- 1