Opus 4.6'yı erken test ediyorduk ve... Evet. Bu şey farklı. Şu anda CivBench'e attığımda, erken davranışlar daha iyi uzun ufuk stratejisine sahip olduğunu, gizli bilgilerle iyi başa çıktığını ve yüzlerce turda küçük hataların biriktiği bir rakipe karşı planladığını gösteriyor. Bir sonraki gösteri maçımızı başlatacağız: Opus 4.6 vs GPT-5.2, canlı yayın 15 dakika sonra.