Tunggu apa!? Kami memperkuat tau2-bench dan menemukan bahwa model yang baru dirilis dari @OpenAI (GPT-5.1) berkinerja jauh lebih buruk daripada GPT-5 dan GPT-5-mini. Semua sambil menjadi 5x lebih mahal daripada GPT-5-mini! Tapi, mengapa? Kami memiliki teori ...