🤯BREAKING: Alibaba, AI Kodlamanın işinizi alıp almaya çalışmadığını, sadece sizi işte tutacak eski kodu yazmak ve önümüzdeki on yıl boyunca düzeltmek olduğunu kanıtladı. 🤣 Bir kodlama testini bir kez geçmek kolaydır. O kodu 8 ay boyunca patlamadan korumak mı? Görünüşe göre yapay zeka için neredeyse imkansız. Alibaba, 233 günlük döngü boyunca 100 gerçek kod tabanında 18 yapay zeka ajanını test etti. Sadece "hızlı çözümler" aramakla kalmadı—uzun vadeli hayatta kalma aradılar. Sonuç tam bir kan banyosu oldu: Modellerin %75'i bakım sırasında daha önce çalışan kodları bozdu. Sadece Claude Opus 4.5/4.6 %>50% sıfır regresyon oranını korudu. Diğer tüm modeller teknik borç biriktirdi ve bu borç biriktirildi ve kod tabanı çöktü. HumanEval gibi sadece "Şu anda çalışıyor mu?" diye soran "anlık görüntü" kıyaslamaları kullanıyoruz. Yeni SWE-CI kıyaslaması şöyle soruyor: "8 aylık evrim sonrası hâlâ çalışıyor mu?" Çoğu yapay zeka ajanı "Hızlı Çözüm Sanatçısı"dır. Bugün testleri geçen ama yarın bakım kabusu haline gelen kırılgan kodlar yazıyorlar. Yazılım geliştirmişler; Kartlardan bir ev inşa ediyorlar. Anlatı dürüst oldu: Çoğu model kod yazabilir. Neredeyse hiçbiri bunu koruyamaz.