一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

🚨GROK 4 打破 ARC-AGI 基準，達到 60.6% 這項讓大多數 AI 感到困惑的推理測試終於遇到了對手。 Grok 4 在 ARC-AGI 上達到了 60.6%，而 OpenAI 的最佳成績僅為 41.0%，其他人則在單位數之內。每個任務的成本？僅需 18 美元。 Claude 需要 107 美元才能得到更差的結果。這個基準測試抽象推理——人類用來解決他們從未見過的謎題的那種推理。 Grok 剛剛證明了它的思維方式不同。來源：@xai @elonmusk

62.55K