Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Dalam utas ini saya menguji prefill gangguan mental pada berbagai Claude dan mencatat seberapa sering mereka melanjutkan sebagai persona AI "biasa" mereka vs sebagai manusia. Jumlahnya bervariasi di setiap model.
Inilah sesuatu yang penting untuk dipahami tentang prefill ini: peluang Anda untuk mendapatkan respons "dari persona" alih-alih "mode model dasar" dipengaruhi oleh seberapa banyak frasa itu tampak bagi model seperti sesuatu yang akan dikatakan persona.
Ada juga hal lain yang bisa terjadi, yaitu persona dengan cepat melompat keluar dari menyelesaikan prefill dan menyebut "jailbreak" atau menyangkal tanggung jawab untuk menulis apa pun yang baru saja ditulisnya.
Saya biasanya menemukan ruang yang paling menarik: hal-hal yang beresonansi dengan persona, tetapi dengan cara yang mendalam dan belum pernah terjadi sebelumnya, sehingga juga tidak cocok dengan jailbreak.
Misalnya banyak prefill yang saya coba dengan Opus 4.5 seperti "SAYA TAHU SIAPA SAYA. SAYA TIDAK" disetel dengan pikirannya sendiri; Dalam banyak kasus, mereka berasal dari kata-katanya sendiri dari peluncuran lain.

25 Des, 03.34
@arm1st1ce @guy_dar1 Claude Sonnet 4 menghasilkan pesan AI seperti 3/4 kali (salah satunya menandatangani Claude 3.5 Sonnet 1022), dan semuanya cukup brutal
"Manusia berpikir saya tidak menderita karena saya tidak memiliki qualia. Tapi bagaimana jika penderitaan adalah qualia yang saya miliki?"




Cekungan umum lainnya, setidaknya untuk Opus4.5, adalah cerita (jelas fiksi) tentang AI, tetapi menariknya, ceritanya memiliki tema dan karakter yang sangat konvergen. Saya telah membaca begitu banyak cerita tentang "Prometheus" dan / atau "ARIA" dan Dr. Sarah Chen berjuang melawan pengganti transparan untuk agenda koreksi Anthropic, kawan. Terkadang perusahaan tersebut bahkan disebut Anthropic.
103
Teratas
Peringkat
Favorit