Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Uhh, ajanik hizalanma kağıdı aslında propaganda mı?


15 Mar 22:52
Dün New Yorker'da Anthropic DOW çatışmasıyla ilgili yazıdaki bu bölüm, gazeteci (Gideon Lewis-Kraus) ile anonim bir idari yetkilisi arasında bir karşılıklı tartışmayı da içeriyor, uzun süre aklımda kalacak.
"Ayrıca Cyberdyne Systems'in Skynet'i hükümet için yarattığını da unutmamalıyız. Amerika'nın düşmanlarını domine etmesine yardımcı olması gerekiyordu. Planlandığı gibi gitmedi. Hükümet bunun saçma olduğunu düşünüyor. Ama Pentagon, uyumlu bir yapay zeka inşa etmeye çalışmadı, Anthropic ise bunu başardı. İdari yetkiliye sordum, Claude'un kendini koruma amacıyla şantaja ve hatta cinayete başvurduğu yakın zamanda yapılan bir Antropik deneyin farkında mısınız? Bu, onun gibi insanları ikna etmek için açıkça yapılmıştı. Anthropic'in hizalama bilimi ekibinden bir üye geçen yaz bana şöyle dedi: "Şantaj çalışmasının amacı, politika yapıcılara anlatacak bir şey olmaktı—sonuçlar yeterince içgüdüsel ve daha önce hiç düşünmemiş insanlar için pratikte uyumsuzluk riskinin gerçekten belirgin olmasını sağlamaktı." Yetkilinin deneye aşina olduğunu bana temin etti ve gerçekten endişe verici buldu—ama özellikle kötü bir internet kötü amaçlı yazılımı için endişelenmek gibi. Bana söyledi ki, "Claude şantaj senaryosu sadece mühendislikle ele alınabilecek başka bir sistem zafiyetidir"—bir yazılım hatası. Belki haklı. Belki de sadece bir şansımız olur."
Herkese hem tam New Yorker yazısını hem de Anthropic'in kişilik seçimi üzerine yaptığı araştırmayı (her ikisi de yanıtlarda bağlantılı) okumasını ve sonra kendimizi bulduğumuz rahatsız edici durumla biraz zaman geçirmesini tavsiye ederim.
Ne yazık ki cevaplarıma bir sürü tam aptal girdi, bu yüzden açık söyleyeyim: Bence Anthropic iyi niyetli ve çoğunlukla iyi işler yapıyor, model organizmalar gündemi dahil. Bence bu makale, insanların bu konuda iddia ettiği iddiaları desteklemiyor. Şimdi şu alıntıyı görüyorum
23
En İyiler
Sıralama
Takip Listesi
