Tôi nghĩ rằng chúng ta đang bắt đầu thấy những mô hình không chỉ trông hữu ích mà thực sự hoàn thành công việc. Cho đến nay, AI đã trông cực kỳ có khả năng, nhưng thường kết thúc trong sự thất vọng Tôi nghĩ rằng việc mở rộng RL thông qua RLVR đang hoạt động và cảm giác như internet vào đầu những năm 90: tiến triển chậm, sau đó nó tăng tốc, rồi đột nhiên trở nên cực kỳ hữu ích.