このモデルがこれらのIMOの問題を解決し、ゴールドレベルの性能を達成するのを見るのは魔法のようでした。いくつかの考え 🧵
Alexander Wei
Alexander Wei7月19日 15:50
1/N 最新の@OpenAI実験的推論 LLM が、世界で最も権威のある数学コンテストである国際数学オリンピック (IMO) で金メダルレベルの成績という、AI における長年の壮大な課題を達成したことを共有できることを嬉しく思います。
このモデルは、リーンやコーディングなどのツールを使用せずにこれらの問題を解決し、自然言語を使用するだけで、時間もわずか 4.5 時間です。モデルの推論は、さまざまな戦略を試し、例から観察し、仮説を検証するなど、非常に高いレベルで見られます。
AIME (GPT 4o) の 12% から ~ 15 か月で IMO ゴールド→上昇したのはクレイジーです。私たちは非常に迅速に遠くまで来ました。来年までにモデルが新しい定理を導き出し、独自の数学研究に貢献しても驚かないでしょう。
538.9K