Yapay zeka benchmarkları, okulda büyüdüğümüz standart testler gibi. OpenAI, 5.2 ile teste alışmış gibi görünüyor ve kendi başına faydalı şeyler yapmaktan çok test yapmada daha iyi bir model yaratmış. Umarım rotası düzeltir. Şu anda Gemini ve Grok kullanıyorum