等等,什麼!?我們強化了 tau2-bench,發現 @OpenAI 新發布的模型(GPT-5.1)的表現遠不如 GPT-5 和 GPT-5-mini。 而且,價格比 GPT-5-mini 貴了 5 倍! 但是,為什麼?我們有一個理論...