熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
這篇MIT論文真是讓我大開眼界 🤯
這篇論文是關於「ARC」,它徹底改變了我對基準的看法。
研究人員根本沒有把ARC當作邏輯謎題來處理。他們把每個任務都視為視覺轉換。
網格進 → 網格出。沒有比這更複雜的了。
他們建立了一個小型的視覺變壓器,從頭開始在ARC的小數據集上進行訓練,並使用一個簡單的畫布技巧將每個例子放置得像一幅圖像。
然後他們添加了比例變化、平移和你在經典計算機視覺工作中會看到的基本視覺先驗。
就這樣。
沒有思考鏈,沒有提示,沒有巧妙的符號技巧。
只有一個模型在觀察像素,學習形狀如何移動、翻轉、增長、崩潰或延續。
最瘋狂的部分?
這個小模型單獨達到54.5%,與U-Net結合時達到60.4%。
這大約是平均人類表現,而這個模型的大小僅相當於一個小型移動應用。
以這種方式看到ARC的解決方案讓整個基準感覺不同。
這些任務突然看起來像是圖像映射,而不是隱藏的規則。反射任務實際上看起來像反射。
對稱任務看起來像對稱。重力任務看起來像是「掉落」到畫布上的碎片。
...

熱門
排行
收藏

