一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

🚨GROK 4 打破 ARC-AGI 基准，达到 60.6% 这个让大多数 AI 感到困惑的推理测试终于遇到了对手。 Grok 4 在 ARC-AGI 上达到了 60.6%，而 OpenAI 的最佳成绩为 41.0%，其他所有人都在个位数。每个任务的成本？仅需 18 美元。 Claude 需要 107 美元才能得到更差的结果。这个基准测试抽象推理——人类用来解决他们从未见过的难题的那种推理。 Grok 刚刚证明了它的思维方式不同。来源：@xai @elonmusk

62.59K