OpenAI çalışanları, xAI'nin son AI modeli Grok3'ün Benchmark test sonuçlarının yanıltıcı olduğunu açıkça belirtiyor.
OpenAI çalışanları, XAI'nin yayınladığı Grok3 AI modeli Benchmark test sonuçlarının yanıltıcı olduğunu iddia etti ancak XAI bu iddiayı reddetti. Grok3, AIME 2025'te OpenAI'in en güçlü modelini geçti ancak grafiklerin tüm karşılaştırma verilerini içermediği iddia edildi. Babu Bushkin, OpenAI'in geçmişte benzer grafikler yayınladığını ve model performansını karşılaştırmak için kullandığını iddia etti.
- 1