Tehlikeli yetenek değerlendirmeleri fikrinin ilk olarak, kamuoyunun stokastik papağanlara ilişkin yorumlarının çoğunun dayandığı bir bağlamda ortaya çıkması ilginçtir ve "Yapay zeka parmak üretemez, nasıl önyargının ötesinde bir tehdit olabilir?" Bu nedenle, neyin mümkün olduğunu daha iyi iletmek için zararlı kullanımların oyuncak versiyonlarını oluşturmak çok mantıklıydı, özellikle de güvenlik görevlilerinin ilerlemenin burada durmayacağına dair doğru sezgileri göz önüne alındığında: yapay zekalar başarısız olsa bile, zaman içinde daha iyi hale geldiklerini göstermek kolay olurdu. Sorun şu ki, bu biraz fazla işe yaradı ve insanlar değerlendirmelerin 'oyuncak versiyonu' kısmını unuttular, medya 'şantaj' veya modellerin temel viroloji MCQ'larında iyi performans göstermesi veya kötü amaçlı yazılımlar için temel kod üretmesi büyük anlaşmalar olarak - değildi. Ancak elbette pek çok savunucu, düzenlemeye neden her zamankinden daha fazla ihtiyaç duyulduğunu göstermek veya işlerin ne kadar kötü olduğunu abartmak için bunları kullanmayı sevdi ('bu iyi' memleri vb.). İnsanlar, alanı karakterize eden derin riskten kaçınma eğiliminin körüklediği 'tehlikeli modeller' hakkında şüpheli iddialarda bulundular. O zamandan beri alan olgunlaştı ve değerlendirmeler daha iyi görünüyor, bunun nedeni kısmen güvenlik tarafının her şeyi ilk ilkelerden çözmeye çalışmak yerine biyo veya siber alandaki alan uzmanlarıyla gerçekten iletişim kurmak zorunda kalmasıydı. Hala birçok değerlendirmeyi temel, statik ve harici olarak geçerli bulmasam da - bunlar önemli göstergeler olmaya devam ediyor. Ancak belirli tehdit modelleri tartışılmaya devam ediyor ve yapay zekanın siber güvenlikte hücum savunma dengesini önemli ölçüde değiştirip değiştirmeyeceği açık bir soru olmaya devam ediyor. Son Antropik raporu harika bir iş ama bu tür saldırıların oldukça yaygın olması nedeniyle çok da önemli görünmüyor; Elbette daha fazla otomasyon söz konusudur ve bunun üzerinde çalışılması gerekir, ancak belirli bir yayılma düzeyinde durumun tek başına böyle olacağı açıktır. Kötü adamların da teknolojiyi kullanmasını beklemelisiniz. Dikkat etmemiz gereken şey, bunun kademeli bir asimetri yaratıp yaratmadığı ve hasarları/maliyetleri/fidyeleri önemli ölçüde artırıp artırmadığı + siber savunmaların/kritik altyapının paralel olarak ne ölçüde güçlendirildiğidir. Bence "tek taraflı hücum avantajı" yerine "dağınık dengeyi" tercih eden önceliklerimiz olmalı.