Espera, o quê!? Robustificamos o tau2-bench e descobrimos que o modelo recém-lançado do @OpenAI (GPT-5.1) tem desempenho muito pior que o GPT-5 e o GPT-5-mini. Tudo isso sendo 5 vezes mais caro que o GPT-5-mini! Mas, por quê? Temos uma teoria...