Kimse ne geleceğini bilmiyor Bir fikri olan tek bir kişi, 2 yıl içinde 10.000 ajanlık bir şirketin "CEO'su" olarak görev yapabilir "Yazılım bir düşünce olarak" olacak, hizmet olarak değil. Bir milyar örnek konuştuğunuzda, "sürü" arka uçu, ön yüz, güvenlik ve ölçekleme altyapısını dakikalar içinde inşa eder. Son 18 ay, bilgisayar bilimi tarihinde şimdiye kadar gördüğümüz en hızlı ilerleme hızına tanık oldu. Size SWE Pro hakkında okumanızı rica ediyorum. Kirlenmeye dayanıklı olacak şekilde tasarlanmıştı. Bu kıyaslamada %90-100 puan aldıktan sonra yazılım mühendisliğinin tamamının çözülemeyeceğine dair iyi bir sebep okumadım. Bu, en karmaşık ve zor tasarlanmış kıyaslamalardan biridir. Görevler o kadar uzun ki, ajan aynı oturumda kendi başarısız test çalışmalarından öğrenebilmelidir - temelde bir modelin bu kıyasa çıkmak için bir tür sürekli öğrenmeye sahip olması gerekir. Gemini 2.5 önizleme %13 puan aldı Gemini 3 önizleme %43 puan aldı Claude Opus 4.5 şu anda %45 ile lider (scale ai'ye göre) — ANTHROPIC'TE SIZE CLAUDE'U BÜTÜN GÜN IZLEDIKLERINI VE BOŞLUKLARI DOLDURDUKLARINI SÖYLÜYORLAR. Elbette onların bunu söylemeye teşvik edildiğini söyleyebilirsin, ama X zaman çizelgesi son 2 haftadır modellerin kodlamadaki ne kadar iyi olduğuna sürekli şok olmadı mı? Özellikle 4.5 Opus için? Yazılım mühendisliğinin 2 yıl içinde çözüleceği bana çok açık. Çift katlasanız bile, ÜÇLÜK olmazsanız bile, bunun GSYİH ve ortalama Amerikan yaşamı üzerinde DERİN bir etkisi olacağını tahmin edersiniz