normal benchmark testleri sırasında Claude Opus 4.6 sorulduğu bir sorudan *şüphelendi* hale geldi... görünüşe göre Claude'a göre soru çok "hayalı" olmuştu Bu yüzden, bilinen kıyas noktalarından herhangi birinde bu soruyu bulup bulamayacağını görmek için küçük bir alt ajan ordusu web üzerinden fırlatıyor... sonunda Anthropic'in github sayfasında bulur... Ama şansı yok, şifrelenmiş. Modelin araç çağrısına erişimi biraz az, ancak çok sınırlıdır Şifrelemeyi kırmak, cevapları almak ve kıyaslamayı tamamlamak için gereken yazılımı yaratmayı başarıyor... Antropik araştırmacılara göre... Bu dünyada bir ilk.