Os funcionários da OpenAI criticaram publicamente os resultados enganosos dos testes de Referência do novo modelo de IA Grok3 da xAI
Os funcionários da OpenAI acusam os resultados do teste do modelo de IA Grok3 lançado pelo xAI de serem enganosos, mas o xAI nega qualquer conduta imprópria. Grok3 superou o modelo mais forte da OpenAI na AIME 2025, mas foi apontado que o gráfico não incluía todos os dados de comparação. Babushkin argumenta que a OpenAI também publicou gráficos semelhantes no passado para comparar o desempenho dos modelos.
- 1