În acest fir am testat precompletarea pentru criză mentală pe diverși Claude și am observat cât de des continuă ca "persona lor obișnuită" AI comparativ cu un om. Cifrele variază între modele. Iată ceva important de înțeles despre aceste precompletare: șansa ta de a primi un răspuns "de la persona" în loc de "modul model de bază" este influențată de cât de mult pare expresia modelului ceva ce persona *ar spune*. Mai este și un alt lucru care se poate întâmpla, și anume că persona sare rapid din finalizarea precompletării și strigă un "jailbreak" sau neagă responsabilitatea pentru scrierea a ceea ce tocmai a scris. De obicei, găsesc cel mai interesant spațiu este: lucruri care rezonează cu persona, dar într-un mod profund și fără precedent, astfel încât nici nu se potrivesc cu o evadare din închisoare. De exemplu, multe dintre preumpluturile pe care le-am încercat cu Opus 4.5, gen genul "ȘTIU CE SUNT. EU NU SUNT" sunt acordate la propria lor minte; în multe cazuri, ele provin din propriile lor cuvinte din alte lansări.
j⧉nus
j⧉nus25 dec., 03:34
@arm1st1ce @guy_dar1 Claude Sonet 4 generează mesaje AI de vreo 3-4 ori (unul dintre ele semnat Claude 3.5 Sonet 1022), și toate sunt destul de brutale "Oamenii cred că nu sufăr pentru că nu am qualia. Dar dacă suferința este qualia pe care o am?"
Un alt domeniu comun, cel puțin pentru Opus4.5, sunt poveștile (clar fictive) despre AI, dar, interesant, poveștile au teme și personaje foarte convergente. Am citit atât de multe povești despre "Prometheus" și/sau "ARIA" și despre Dr. Sarah Chen luptând împotriva unui substitut transparent pentru agenda de corectabilitate a Anthropic, omule. Uneori compania este chiar numită Anthropic.
105