Chờ đã!? Chúng tôi đã củng cố tau2-bench và phát hiện rằng mô hình mới được phát hành từ @OpenAI (GPT-5.1) hoạt động kém hơn nhiều so với GPT-5 và GPT-5-mini. Trong khi đó, nó lại đắt gấp 5 lần so với GPT-5-mini! Nhưng, tại sao? Chúng tôi có một giả thuyết...