Gate News bot 消息,苹果研究人员在 6 月份发表的一篇名为《思考的幻觉》的论文中指出,领先的人工智能 (AGI) 模型在推理方面仍存在困难,因此,开发通用人工智能 (AGI) 的竞赛仍任重道远。文章指出,主流人工智能大型语言模型 (LLM)(例如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude)的最新更新已包含大型推理模型 (LRM),但其基本功能、扩展特性和局限性“仍未得到充分理解”。目前的评估主要侧重于既定的数学和编码基准,“强调最终答案的准确性”。然而,研究人员表示,这项评估并未深入了解人工智能模型的推理能力,与通用人工智能仅需几年就能实现的预期形成了鲜明对比。