Menyaksikan model memecahkan masalah IMO ini dan mencapai kinerja tingkat emas sangat ajaib. Beberapa pemikiran 🧵
Alexander Wei
Alexander Wei19 Jul, 15.50
1/N Saya senang berbagi bahwa penalaran @OpenAI eksperimental terbaru kami LLM telah mencapai tantangan besar yang sudah lama ada di AI: kinerja tingkat medali emas pada kompetisi matematika paling bergengsi di dunia—Olimpiade Matematika Internasional (IMO).
Model ini memecahkan masalah ini tanpa alat seperti lean atau coding, hanya menggunakan bahasa alami, dan juga hanya memiliki 4,5 jam. Kami melihat alasan model pada tingkat yang sangat tinggi - mencoba strategi yang berbeda, membuat pengamatan dari contoh, dan menguji hipotesis.
Sungguh gila bagaimana kami telah beralih dari 12% pada AIME (GPT 4o) → emas IMO dalam ~ 15 bulan. Kami telah melangkah sangat jauh dengan sangat cepat. Saya tidak akan terkejut jika pada tahun depan model akan menurunkan teorema baru dan berkontribusi pada penelitian matematika asli!
538,9K