等一下!?我们增强了 tau2-bench,发现 @OpenAI 新发布的模型(GPT-5.1)的表现远不如 GPT-5 和 GPT-5-mini。 而且,GPT-5.1 的价格是 GPT-5-mini 的 5 倍! 但是,为什么?我们有一个理论...