¿Espera, qué? Reforzamos tau2-bench y descubrimos que el modelo recién lanzado de @OpenAI (GPT-5.1) funciona mucho peor que GPT-5 y GPT-5-mini. ¡Todo ello siendo 5 veces más caro que GPT-5-mini! ¿Pero por qué? Tenemos una teoría...