🚨GROK 在「人類的最後考試」中以 26.9% 的成績獲得成功,且沒有使用任何工具 這個擴展圖表講述了故事:更多的計算能力 = 更好的表現。 Grok 僅憑純粹的推理能力,擊潰了全球最艱難的學術基準的四分之一。 沒有計算器,沒有外部幫助。 只有原始的 AI 智力,解答了 2,500 道涉及人類知識各個領域的問題。 大多數人類即使有工具也會在這個測試中失敗。 Grok 是在蒙著眼睛的情況下完成的。 來源:@xai @elonmusk
Mario Nawfal
Mario Nawfal7月10日 12:14
🚨「人類的最後考試」已經推出:2500個問題來區分真正的AI與偽裝者 X剛剛揭示了終極學術挑戰 - 一個如此全面的基準,旨在成為最後一次所需的考試。 數學佔41%,其次是科學和人文。 這個名字說明了一切:這是結束所有考試的考試。一旦AI通過這個考試,還有什麼需要證明的呢? 我們正在建立一個測試,來確定機器何時正式超越我們的智慧。 來源:@xai @elonmusk
89.6K