انتظر، ماذا!؟ قمنا بتقوية tau2-bench ووجدنا أن الطراز الجديد من @OpenAI (GPT-5.1) يؤدي أداء أسوأ بكثير من GPT-5 وGPT-5-mini. وكل ذلك بينما هو أغلى بخمس مرات من GPT-5-mini! لكن لماذا؟ لدينا نظرية...