Mengklarifikasi Kinerja ARC-AGI o3 OpenAI telah mengonfirmasi: * O3 yang dirilis adalah model yang berbeda dari yang kami uji pada Desember 2024 * Semua tingkat komputasi o3 yang dirilis lebih kecil dari versi yang kami uji * O3 yang dirilis tidak dilatih pada data ARC-AGI, bahkan set kereta * O3 yang dirilis disetel untuk penggunaan obrolan/produk, yang memperkenalkan kekuatan dan kelemahan pada ARC-AGI Apa yang akan dilakukan ARC Prize: * Kami akan menguji ulang o3 yang dirilis (semua tingkat komputasi) dan menerbitkan hasil yang diperbarui. Skor sebelumnya akan diberi label "pratinjau" * Kami akan menguji dan merilis hasil o4-mini sesegera mungkin * Kami akan menguji o3-pro setelah tersedia
127,39K