METR'in son değerlendirmeleri GPT-5.2 (Yüksek) seviyesinin "%50 zaman ufkusu" olan 6,6 saati aştığını gösteriyor. Bilmeyenler için, metodolojileri, insan uzmanın bir görevi tamamlamasının süresini zamanlayarak otonom yeteneği ölçüyor; yapay zeka ise artık zamanın yarısını başarıyla tamamlayabilir. OpenAI ile "Hafif Yükseliş"ten bahsettim ve bu bir başka kanıt. Bu yörünge, Hafif Kalkış'ın tanımıdır - pürüzsüz ama gerçek bir üstel ivme. Yetenek ikiye katlama süresi 212 günden sadece 128 güne küçüldü. Bu 6,6 saatlik rekor, daha güçlü "XHigh" ayarıyla değil, "Yüksek" akıl yürütme çabasıyla kırıldı. GPT-5.2 zaten Claude 4.5 Opus'u (5.3 saat) %25 farkla geçiyorken, "XHigh" versiyonu muhtemelen ufku 10+ saati aşıyor. Bu, OpenAI'nin mantık hesaplamasını başarıyla ölçeklendirdiğini kanıtlıyor. Ve bu 5.3 bile değil!