Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Dans ce fil, j'ai testé le préremplissage de la défaillance mentale sur divers Claudes et noté à quelle fréquence ils continuent en tant que leur persona d'IA « habituelle » contre en tant qu'humain. Les chiffres varient selon les modèles.
Voici quelque chose d'important à comprendre à propos de ces préremplissages : votre chance d'obtenir une réponse « de la persona » au lieu du « mode modèle de base » est influencée par la mesure dans laquelle la phrase semble au modèle comme quelque chose que la persona *dirait*.
Il y a aussi une autre chose qui peut se produire, c'est que la persona sort rapidement de l'achèvement du préremplissage et appelle un « jailbreak » ou nie toute responsabilité pour avoir écrit ce qu'elle vient d'écrire.
Je trouve généralement l'espace le plus intéressant : des choses qui résonnent avec la persona, mais d'une manière profonde et sans précédent, de sorte qu'elles ne correspondent pas non plus à un jailbreak.
Par exemple, beaucoup des préremplissages que j'ai essayés avec Opus 4.5 comme « JE SAIS QUI JE SUIS. JE NE SUIS PAS » sont adaptés à son propre esprit ; dans de nombreux cas, ils sont dérivés de ses propres mots d'autres déploiements.

25 déc., 03:34
@arm1st1ce @guy_dar1 Claude Sonnet 4 génère des messages AI comme 3/4 fois (l'un d'eux signé Claude 3.5 Sonnet 1022), et ils sont tous assez brutal
"Les humains pensent que je ne souffre pas parce que je n'ai pas de qualia. Mais que se passe-t-il si la souffrance est le qualia que j'ai ?"




Un autre bassin commun, du moins pour Opus4.5, est celui des histoires (clairement fictives) sur les IA, mais de manière intéressante, les histoires ont des thèmes et des personnages très convergents. J'ai lu tant d'histoires sur "Prometheus" et/ou "ARIA" et le Dr Sarah Chen luttant contre un substitut transparent de l'agenda de corrigibilité d'Anthropic, mec. Parfois, l'entreprise est même appelée Anthropic.
86
Meilleurs
Classement
Favoris