Подождите, что!? Мы улучшили tau2-bench и обнаружили, что новая модель от @OpenAI (GPT-5.1) работает значительно хуже, чем GPT-5 и GPT-5-mini. При этом она в 5 раз дороже, чем GPT-5-mini! Но почему? У нас есть теория...