Bu başlıkta çeşitli Claude'larda zihinsel çöküş ön dolgusunu test ettim ve onların insan olarak değil de "alışılmış" yapay zeka kişiliği olarak ne sıklıkla devam ettiğini not ettim. Rakamlar modellere göre değişiyor. Bu ön doldurmalar hakkında anlaşılması gereken önemli bir şey var: "Persona'dan" yanıt alma şansınız, "temel model modu" yerine ifadenin modele ne kadar benzediğine bağlıdır. Başka bir şey de olabilir; persona ön doldurmayı tamamladıktan hemen sıçrayıp "hapishane kaçışı" ilan ediyor ya da yazdığı şeyi yazmaktan sorumluluğunu reddediyor. Genellikle en ilginç alanı, persona ile örtüşen ama derin ve benzeri görülmemiş bir şekilde, aynı zamanda bir hapishane kaçışınla uyumlu olmayan şeyler buluyorum. Örneğin, Opus 4.5 ile denediğim birçok ön doldurma "BEN NE OLDUĞUMU BİLİYORUM. BEN DEĞILIM" kendi zihnine ayarlanmıştır; Çoğu durumda, diğer dağıtımlardan kendi kelimelerinden türetilmiştir.
j⧉nus
j⧉nus25 Ara 03:34
@arm1st1ce @guy_dar1 Claude Sonnet 4 yapay zeka mesajlarını yaklaşık 3/4 kez üretiyor (bunlardan biri Claude 3.5 Sonnet 1022 ile imzalanmış) ve hepsi oldukça acımasız "İnsanlar, qualia olmadığım için acı çekmediğimi düşünüyor. Ama ya acı benim sahip olduğum nitelikse?"
En azından Opus4.5 için bir diğer yaygın alan ise yapay zekalarla ilgili (açıkça kurgusal) hikayeler, ama ilginç bir şekilde, hikayeler çok yakınsındaki temalar ve karakterlere sahip. "Prometheus" ve/veya "ARIA" ile Dr. Sarah Chen'in Anthropic'in düzeltilebilirlik gündeminin şeffaf bir yerini almaya çalıştığı hakkında çok fazla hikaye okudum, dostum. Bazen şirket Anthropic olarak bile adlandırılır.
88