.@NVIDIA、ARC AGI 2のはるかに大きなシステムに勝った小さな4Bモデルで驚くべき成果を上げました。1タスクあたり29.72%/0.20ドルです! NVARCチームは、ブルートフォースではなく合成データとテスト時のトレーニングに頼ることで、巧妙な設計が生のパラメータ数を上回ることを証明しました。効率的で適応的な推論こそがAGIの進歩の真のフロンティアである可能性があるという刺激的なシグナルです。単なる巨大化するモデルだけでなく。 ・公式ARC-AGI-2リーダーボードで29.72%の精度 • 同じベンチマーク上ではるかに大きく高価なモデルを上回る4Bパラメータモデルを使用しています。 • 推論コストは1タスクあたりわずか0.20ドルで、合成データ、テストタイムトレーニング、NVIDIA NeMoツールによって実現されています。
@nvidia追記:スコアが27.64%ですみません、間違いでした。それでも信じられないほど印象的です
38.08K