熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
🚨GROK 在「人類的最後考試」中以 26.9% 的成績獲得成功,且沒有使用任何工具
這個擴展圖表講述了故事:更多的計算能力 = 更好的表現。
Grok 僅憑純粹的推理能力,擊潰了全球最艱難的學術基準的四分之一。
沒有計算器,沒有外部幫助。
只有原始的 AI 智力,解答了 2,500 道涉及人類知識各個領域的問題。
大多數人類即使有工具也會在這個測試中失敗。
Grok 是在蒙著眼睛的情況下完成的。
來源:@xai @elonmusk


7月10日 12:14
🚨「人類的最後考試」已經推出:2500個問題來區分真正的AI與偽裝者
X剛剛揭示了終極學術挑戰 - 一個如此全面的基準,旨在成為最後一次所需的考試。
數學佔41%,其次是科學和人文。
這個名字說明了一切:這是結束所有考試的考試。一旦AI通過這個考試,還有什麼需要證明的呢?
我們正在建立一個測試,來確定機器何時正式超越我們的智慧。
來源:@xai @elonmusk

89.6K
熱門
排行
收藏