METRの最新評価では、GPT-5.2(ハイ)は「50%の時間範囲」で6.6時間に達しています。 知らない人のために説明すると、彼らの手法は、AIが半分の確率で成功裏に完了できるタスクを、人間の専門家が完了するのにかかる時間を計測することで自律能力を測定しています。 私はOpenAIの「ライトテイクオフ」について話しましたが、これがさらなる証拠です。この軌道はライトテイクオフの定義であり、滑らかでありながら実際の指数関数的な加速度です。能力倍増の時間は212日からわずか128日に短縮されました。 この6.6時間の記録は、さらに強力な「XHigh」設定ではなく、「高」推論力で樹立されました。GPT-5.2はすでにClaude 4.5 Opus(5.3時間)を25%上回っているため、「XHigh」バージョンはおそらく10+時間を超えてプレイ時間を押し上げるでしょう。これはOpenAIが推論計算のスケーリングに成功していることの証明です。しかもこれは5.3にも満たない!