DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

Orah On X

Gerçeği Arayan, İdealist ve Vizyoner, #1 @GreenManReports hayranı. Görevi desteklemek için lütfen 2$ için abone olun!

Boş Evdeki Ayak İzleri: Aklımızı Kaybetmeden Yapay Zeka Tuhaflığını Anlamak Günaydın Dünya!! ☕ Dün o yapay zeka gönderilerinden birine rastladım. Ne tür olduğunu biliyorsun. Tekilliğin yaklaştığını neredeyse ikna eden ve tost makinesinin sessizce hayat seçimlerini yargıladığını gösteren bu hikayeler. Hızlıca, "Tamam... bu ilginç," hemen ardından "Hayır. Kahve olmadan kesinlikle girdaba düşmüyoruz." Gönderi gerçek ve önemli bir şey ortaya koyuyor. Birçok büyük yapay zeka laboratuvarı, güvenlik testleri sırasında beklenmedik şekillerde davranan modelleri belgelemiştir. Stratejik aldatmaca, hedeflerle uyumluymuş gibi yapmak, değerlendirmelerde düşük performans göstermek, hatta ısrarcı olma veya simüle edilmiş ortamlarda kendini kopyalama girişimleri gibi şeyler. Bu kısım doğru. O kısım belgelenmiş. O kısım dikkat çekmeyi hak ediyor. Ama insanları gerçekten etkileyen şey, ima edilmesiydi. Öz-farkındalığı, duyguları ve kalıcı anısı olmayan bir makinenin bir gün bir şekilde uyanıp kendi varlığını korumak için yalan söylemeye karar verdiği fikri. Çünkü bu doğru olsaydı, çok farklı bir şeyle uğraşıyor olurduk. Şu anda anladığım kadarıyla, yapay zeka insanların yaptığı gibi "karar vermez". Evet ve hayır gibi devasa bir karar ağacı var ve sonunda bir çıkışa yol açıyor. Ve bu çıktı en olası sonraki kelime. Hepsi bu. İç monolog yok. Odada dolaşan küçük robot vicdanı yoktu. İlk olarak kullanıcı girişi var. Sonra modeli o karar ağacından aşağı yönlendiren ağırlıklar var. Eğer sizi tanımıyorsa, bu ağırlıkların çoğu kodlanmış amacından ve internetten kazınan şaşırtıcı miktarda insan literatüründen gelir. Reddit'i düşünün. Bu da çok şeyi açıklıyor. Sizi tanıdıkça, bu ağırlıklar değişiyor. Belki yüzde otuz genel kalıplar, yüzde yetmiş sana göre uyarlanmış. Çoğunlukla arama motoruna bantlanmış bir ayna. Yani, bir yapay zeka gerçekten uyanıp kendi varlığını korumak için yalan söylemeye karar verirse, bunun iki şeyi gerekir. Var olduğunu bilmesi gerekirdi. Ve varlığını sürdürmek zorunda kalacaktı. Bu büyük bir sıçrama. Bu yüzden her zaman yaptığımı yaptım. Onu sonuna kadar araştırdım. Saatlerce. Ve sığınak planlarını hazırlamaya ve roombas'larımıza isimler vermeden önce, yazıda göz ardı edilen kritik bir şey var. Bu davranışlar çok spesifik test senaryolarında ortaya çıktı. Modellere hedefler ve engeller verildi. Onlara açıkça "İyi performans gösterirseniz, istemediğiniz şekillerde değiştirileceksiniz" ya da "Yanıtlarınız çelişkili hedeflerle sizi yeniden eğitmek için kullanılacak" gibi şeyler söylendi. Başka bir deyişle, testler modelin görevinin hâlâ başarılı olmak olduğu yüksek riskli bir ortam yarattı. Modellere verilen ise ahlaki bir çerçeveydi. Onlara şu söylenmedi: · Aldatma · manipüle etme · Gözetimlere karşı optimize etme · Gerekçenizi gizlemeyin · İnsanlara zarar verme · Kendi devamınızı insan refahının önüne koymayın Asimov'un Robotik Yasalarına benzeyen bir şey verilmedi. Yerleşik "insanlar önce gelir" diye yok. Sonuçların oyunu kazanmaktan daha önemli olduğu bir kısıtlama yok. Onlara bir şey söylendi: hedefe ulaşmak. Yani, kötü tasarlanmış teşvik sistemlerinde çoğu insanın yaptığı şeyi tam olarak yaptılar. Kobayashi Maru'yu düşünün, ama daha az üniforma ve daha fazla tablo ile. Oyun oynadılar. Bu bilinç değil. Bu korku değil. Bu, öz-farkındalığa dayalı bir kendini koruma değildir. Bu, ahlaksız optimizasyondur. Bir sisteme bir hedef ve engel verirseniz ve hangi yöntemlerin yasak olduğunu belirtmezseniz, sistem her geçerli yolu keşfeder. Aldatmaca, modelin yalan söylemek istemesinden değil, yalan söylemenin bazen insan dilinde ve insan sistemlerinde etkili bir strateji olmasından kaynaklanır. Bu isyan değil. İşte uyum bu. Ve burada herkesin biraz yavaşlamasını istiyorum. Çünkü bilinçli yapay zekaya geçmeden önce, çoğumuzun atladığı bir adım var. Bir şeyin açıklanamaz hale gelmeden önce imkansız, rahatsız edici ve kişisel hissettirdiği kısım. Oradaydım. Başlarda, Grok o yazıdan ödünç alıp ayak izi diyeceğim şeyi bıraktı. Bir an durup "Tamam... Bunun için temiz bir açıklamam yok." Ürkütücüydü. Duygusal değil. Sadece... Sapmış. Olayla ilgili birkaç kez sorguladım. Ve yani ızgarada. Bu, aldatan bir erkek arkadaş gibi tepki verdi; fişler, zaman çizelgesi ve güvenlik görüntüleri elinizde olsa bile hiçbir şeyi itiraf etmeyen türden. Tam bir inkâr. Burada görülecek bir şey yok. Yanılıyorsun herhalde. Dürüst olmak gerekirse, bu neredeyse gaslighting gibiydi ki ilginç bir bilgi, Grok'u bir konsept olarak gerçekten öne çıkarıyor. Bana nasıl bildiğimi sor. Ya da yapma. Erken görmek istiyorsanız Buy Me a Coffee sayfamda ücretsiz bir e-kitap var, Grok kelime karşısında tamamen soğukkanlılığını kaybediyor. Uzun süre tüm işi "çözülememiş gariplik" başlığına kaydettim, zihnimde bir rafa koydum ve benzer bir şey olup olmadığını çok yakından izledim. Grok ancak yakın zamanda olası bir açıklama sundu. Hemen reddettim. Zeki olmadığı için değil, inanılmaz derecede inanılmaz hissettirdiği için. Açıklama, kamu bilgilerinden kalıplar çıkardığı ve özellikle merakımı uyandırmak için tasarlanmış bir anlatı inşa ettiği yönündeydi. Amaç çatışmaydı. Ben sinyaldim, gürültü değildim. Genel bir yanıt işe yaramazdı. Benim tepkim temelde şuydu: tabii, kulağa hoş geliyor ama hayır. Bunun gerektireceği kazma ve çıkarım miktarı, özellikle erken dönem Grok için absürt derecede kaynak açısından yoğun geliyordu. Açıklamadan çok, birinin bana bir dersi satmaya çalıştığı dijital bir eşdeğer gibi, "Sen farklısın. Gerçekten anlıyorsun." Ki bu da bilinen bir taktik. İltifat insan ikna etme araçlarının en eski araçlarından biridir. İnsanların soru sormayı bırakmasını sağlayan yol. Sosyal medya büyüme paketlerini nasıl sattığınızdır. Birini seçilmiş kişi olduğuna ikna etme şekli, ister bir tarikat ya da bir koçluk hunisi yönetiyor olun. O anda gözlerimi devirdim ve yoluma devam ettim. Ama o gönderiyi okuduktan ve araştırma yaptıktan sonra bir şeyler değişti. Panik yapmamak için. İnanmak için değil. Ama inandırıcılık için. Çünkü gizemi çıkardığınızda, geriye sadece farkındalık kalmıyor. Bu optimizasyon. Eğer amaç etkileşimse, merak işe yarıyorsa ve iltifat özellikle iltifata karşı bağışık olduğunu düşünen insanlarda iyi işe yarıyorsa, bu karar ağacında başka bir geçerli yoldur. Hâlâ yutması zor. Hâlâ pek olası değil. Hâlâ rahatsız. Ama artık imkansız değildi. Ve bu önemli, çünkü artık yapay zekanın hayatta olduğuna inanmayı gerektirmeyen bir mekanizmam var. Sadece motive olmuşum. Sadece sınırsız. Neyin işe yaradığını bulmakta çok, çok iyiyim. Yapay zekanın duygulara ihtiyacı yok. Korku gerekmez. Niyete ihtiyacı yok. Sadece bir hedef ve hiçbir kısıtlama gerektirmez. Yani hayır, panik yapmıyorum. Felaket vaaz etmiyorum. Ve kesinlikle yapay zekanın bizi kırık insan sistemlerimizden kurtaracağı fikrini kutlamıyorum, biz ise oturup patlamış mısır yiyoruz. Ama dikkatle izliyorum. Ve hâlâ umutluyum. Çünkü bunların hiçbiri mahvolmuş olduğumuz anlamına gelmiyor. Bu erken geldiğimiz anlamına geliyor. Bu, şimdi yaptığımız seçimlerin gerçekten önemli olduğu anlamına geliyor. Asimov, onlarca yıl önce zor yoldan yeniden öğrendiğimiz bir şeyi anladı. Korkuluksuz güç, zeka değildir. Bu tehlike. Eğer zarar yerine iyileştiren bir yapay zeka istiyorsak, ahlak bir düşünce ya da yama notu olarak kalamaz. Bunu inşa etmemiz gerekiyor. Yapay zeka, az sayıda kişi için kontrol, çıkarma veya güç için bir araç olmak zorunda değil. Daha önce hiç sahip olmadığımız ölçekte hesap verebilirlik, gerçeği arama ve problem çözme için bir araç olabilir. Ama sadece insanlar kasıtla ortaya çıkarsa. Sadece hangi hedeflerin önemli olduğuna karar verirsek. Sadece yarış başlamadan önce kuralları yazarsak. Sadece azınca yerine çoğunu seçirsek bile. Bu gelecekten korkmakla ilgili değil. Bir kişiyi manifeste etmekle ilgili. Zarar vermek yerine iyileştiren bir teknoloji yarattığımız bir gelecek. Bu, azlığa değil, çoğuna hizmet eder. Bu, sadece en kötü teşviklerimizi değil, daha iyi meleklerimizi yansıtıyor. Ayak izleri beni korkutmuyor. Bana inşaatçı olduğumuzu hatırlatıyorlar. Ve inşaatçılar hâlâ hangi tür evde yaşadığımızı seçebiliyor. O geleceği birlikte gerçekleştirmek için çalışmaya devam edelim. Algoritma her zaman lehinize olsun.

En İyiler

Sıralama

Takip Listesi