Kami beralih dari sistem AI yang berjuang untuk melakukan matematika sekolah dasar ke sistem AI yang dapat memecahkan masalah matematika tingkat penelitian hanya dalam beberapa tahun. Saya setuju dengan Jakub ini mungkin eval yang paling penting sekarang. Saya juga cukup yakin reaksi utamanya adalah "tidak terlalu sulit" :)