As avaliações mais recentes da METR mostram que o GPT-5.2 (Alto) atinge um "horizonte de tempo de 50%" de 6,6 horas. Para quem não sabe, a metodologia deles mede a capacidade autônoma cronometrando quanto tempo um especialista humano leva para concluir uma tarefa que a IA agora consegue completar com sucesso metade das vezes. Falei de "Light Takeoff" com a OpenAI e isso é mais uma prova. Essa trajetória é a definição de Decolagem Leve – uma aceleração esponencial suave, porém real. O tempo de duplicação da capacidade diminuiu de 212 dias para apenas 128 dias. Esse recorde de 6,6 horas foi estabelecido usando um esforço de raciocínio "Alto", não a ainda mais poderosa configuração "XHigh". Com o GPT-5.2 já superando o Claude 4.5 Opus (5,3 horas) por 25%, a versão "XHigh" provavelmente ultrapassa o horizonte de 10+ horas. Isso prova que a OpenAI está escalando com sucesso o cálculo de raciocínio. E isso nem é 5,3!