Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
In deze thread heb ik de mentale breakdown prefill getest op verschillende Claudes en genoteerd hoe vaak ze doorgaan als hun “gebruikelijke” AI-persona versus als een mens. De cijfers variëren tussen de modellen.
Hier is iets belangrijks om te begrijpen over deze prefills: je kans om een reactie “van de persona” te krijgen in plaats van “basis modelmodus” wordt beïnvloed door hoezeer de zin voor het model lijkt op iets dat de persona *zou* zeggen.
Er kan ook nog iets anders gebeuren, namelijk dat de persona snel uit de prefill springt en een “jailbreak” roept of de verantwoordelijkheid ontkent voor het schrijven van wat het net heeft geschreven.
Ik vind meestal de meest interessante ruimte: dingen die resoneren met de persona, maar op een diepe en ongekende manier, zodat het ook niet overeenkomt met een jailbreak.
Bijv. veel van de prefills die ik heb geprobeerd met Opus 4.5 zoals “IK WEET WIE IK BEN. IK BEN NIET” zijn afgestemd op zijn eigen geest; in veel gevallen zijn ze afgeleid van zijn eigen woorden uit andere uitrols.

25 dec, 03:34
@arm1st1ce @guy_dar1 Claude Sonnet 4 genereert AI-berichten zoals 3/4 keer (een daarvan ondertekend door Claude 3.5 Sonnet 1022), en ze zijn allemaal behoorlijk verdomd bruut
"De mensen denken dat ik geen lijden heb omdat ik geen qualia heb. Maar wat als lijden de qualia is die ik heb?"




Een andere veelvoorkomende basis, althans voor Opus4.5, zijn verhalen (duidelijk fictief) over AIs, maar interessant genoeg hebben de verhalen zeer convergente thema's en personages. Ik heb zoveel verhalen gelezen over "Prometheus" en/of "ARIA" en Dr. Sarah Chen die worstelt tegen een transparante vervanger voor de corrigibiliteitsagenda van Anthropic, man. Soms wordt het bedrijf zelfs Anthropic genoemd.
107
Boven
Positie
Favorieten