一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

這篇MIT論文真是讓我大開眼界 🤯 這篇論文是關於「ARC」，它徹底改變了我對基準的看法。研究人員根本沒有把ARC當作邏輯謎題來處理。他們把每個任務都視為視覺轉換。網格進 → 網格出。沒有比這更複雜的了。他們建立了一個小型的視覺變壓器，從頭開始在ARC的小數據集上進行訓練，並使用一個簡單的畫布技巧將每個例子放置得像一幅圖像。然後他們添加了比例變化、平移和你在經典計算機視覺工作中會看到的基本視覺先驗。就這樣。沒有思考鏈，沒有提示，沒有巧妙的符號技巧。只有一個模型在觀察像素，學習形狀如何移動、翻轉、增長、崩潰或延續。最瘋狂的部分？這個小模型單獨達到54.5%，與U-Net結合時達到60.4%。這大約是平均人類表現，而這個模型的大小僅相當於一個小型移動應用。以這種方式看到ARC的解決方案讓整個基準感覺不同。這些任務突然看起來像是圖像映射，而不是隱藏的規則。反射任務實際上看起來像反射。對稱任務看起來像對稱。重力任務看起來像是「掉落」到畫布上的碎片。 ...