Selamat kepada tim GDM atas hasil IMO mereka! Saya pikir keberhasilan paralel mereka menyoroti seberapa cepat kemajuan AI. Pendekatan mereka sedikit berbeda dari kami, tetapi saya pikir itu menunjukkan ada banyak arah penelitian untuk kemajuan lebih lanjut. Beberapa pemikiran tentang model dan hasil 🧵 kami
~2 bulan yang lalu, IMO mengirim email kepada kami tentang berpartisipasi dalam versi formal (Lean) IMO. Kami telah fokus pada penalaran umum dalam bahasa alami tanpa batasan Lean, jadi kami menolak. Kami tidak pernah didekati tentang pilihan matematika bahasa alami.
Selama beberapa bulan terakhir, kami membuat banyak kemajuan dalam penalaran umum. Ini melibatkan pengumpulan, kurasi, dan pelatihan data matematika berkualitas tinggi, yang juga akan masuk ke model masa depan. Dalam evaluasi IMO kami, kami tidak menggunakan RAG atau alat apa pun.
Sebelum kami membagikan hasil kami, kami berbicara dengan anggota dewan IMO, yang meminta kami untuk menunggu sampai setelah upacara penghargaan untuk mempublikasikannya, sebuah permintaan yang kami hormati dengan senang hati.
Kami mengumumkan pada ~ 1 pagi PT (6 sore AEST), setelah upacara penghargaan berakhir. Tidak ada yang meminta agar kami mengumumkan lebih lambat dari itu.
Lebih dari segalanya, kami bersemangat untuk berbagi kemajuan dan hasil kami dengan dunia. Kemampuan penalaran AI berkembang pesat, dan hasil IMO ini benar-benar menunjukkannya.
295,92K