.@NVIDIA 剛剛使用一個小型的 4B 模型成功地完成了一個驚人的任務,該模型在 ARC AGI 2 上的表現超越了更大型的系統,準確率為 29.72% / 每個任務 $0.20! 通過依賴合成數據和測試時訓練,而不是單純的擴展規模,NVARC 團隊證明了巧妙的設計可以超越原始參數數量。這是一個令人興奮的信號,顯示高效、適應性推理可能是 AGI 進展的真正前沿——而不僅僅是越來越大的模型。 • 在官方 ARC-AGI-2 排行榜上的準確率為 29.72% • 使用一個 4B 參數的模型,在相同基準上超越了更大型、更昂貴的模型。 • 推理成本僅為每個任務 $0.20,這得益於合成數據、測試時訓練和 NVIDIA NeMo 工具。
@nvidia 編輯:抱歉,分數是27.64%,我犯了個錯。但仍然令人難以置信的印象深刻
38.08K