Saya pikir kita mulai melihat model yang tidak hanya terlihat berguna mereka benar-benar menyelesaikan sesuatu. sejauh ini, AI terlihat sangat mumpuni, tetapi sering kali berakhir frustrasi saya pikir penskalaan RL melalui RLVR berhasil Dan rasanya seperti internet di awal 90-an: kemajuan lambat, lalu bola salju, lalu tiba-tiba sangat berguna