Công ty OpenAI đã công khai chỉ trích kết quả kiểm tra Điểm chuẩn của mô hình trí tuệ nhân tạo mới nhất xAI Grok3 là có tính đa nghĩa
Nhân viên của OpenAI chỉ trích kết quả kiểm tra Điểm chuẩn của mô hình AI Grok3 do XAI phát hành có tính đánh lừa, nhưng XAI phủ nhận hành vi không đúng. Grok3 vượt qua mô hình mạnh nhất của OpenAI tại AIME 2025, nhưng bị chỉ trích vì biểu đồ không bao gồm tất cả dữ liệu so sánh. Babushkin lập luận rằng OpenAI cũng đã từng phát hành biểu đồ tương tự trong quá khứ để so sánh hiệu suất mô hình.
- 1