Sledovat, jak model řeší tyto problémy IMO a dosahuje výkonu na zlaté úrovni, bylo kouzelné. Pár myšlenek 🧵
Alexander Wei
Alexander WeiPřed 22 h
1/N S potěšením se s vámi podělím o to, že naše nejnovější @OpenAI experimentální uvažování LLM dosáhlo dlouhodobé velké výzvy v oblasti umělé inteligence: výkonu na úrovni zlaté medaile na nejprestižnější matematické soutěži na světě – Mezinárodní matematické olympiádě (IMO).
Model tyto problémy řeší bez nástrojů jako je lean nebo kódování, používá pouze přirozený jazyk a také má pouze 4,5 hodiny. Modelový rozum vnímáme na velmi vysoké úrovni - zkoušení různých strategií, pozorování z příkladů, testování hypotéz.
Je šílené, jak jsme se dostali z 12 % na AIME (GPT 4o) → na zlato IMO za ~ 15 měsíců. Došli jsme velmi daleko a velmi rychle. Nepřekvapilo by mě, kdyby od příštího roku modely odvozovaly nové věty a přispívaly k původnímu matematickému výzkumu!
394,93K