أعتقد أننا بدأنا نرى نماذج لا تبدو مفيدة فقط هم فعلا ينجزون الأمور. حتى الآن، بدا الذكاء الاصطناعي قادرا للغاية، لكنه غالبا ما ينتهي بالإحباط أعتقد أن توسيع التعلم الواقعي عبر RLVR يعمل بشكل جيد ويشعر الأمر وكأنه الإنترنت في أوائل التسعينات: تقدم بطيء، ثم يتسارع، وفجأة يصبح مفيدا للغاية