Các đánh giá mới nhất của METR cho thấy GPT-5.2 (Cao) đạt được "horizon thời gian 50%" là 6.6 giờ. Đối với những người không biết, phương pháp của họ đo lường khả năng tự động bằng cách tính thời gian mà một chuyên gia con người mất để hoàn thành một nhiệm vụ mà AI hiện có thể hoàn thành thành công một nửa thời gian. Tôi đã nói về "Cất cánh nhẹ" với OpenAI và đây là bằng chứng thêm. Đường đi này là định nghĩa của Cất cánh nhẹ - một sự gia tốc mượt mà nhưng thực sự theo cấp số nhân. Thời gian gấp đôi khả năng đã giảm từ 212 ngày xuống chỉ còn 128 ngày. Kỷ lục 6.6 giờ này được thiết lập bằng cách sử dụng nỗ lực lý luận "Cao", không phải cài đặt "XHigh" còn mạnh mẽ hơn. Với GPT-5.2 đã đánh bại Claude 4.5 Opus (5.3 giờ) tới 25%, phiên bản "XHigh" có khả năng đẩy horizon vượt qua 10+ giờ. Điều này chứng minh rằng OpenAI đang thành công trong việc mở rộng khả năng tính toán lý luận. Và đây còn chưa phải là 5.3!