In diesem Thread habe ich die mentale Zusammenbruchsvorbefüllung bei verschiedenen Claudes getestet und notiert, wie oft sie als ihre „gewöhnliche“ KI-Persona im Vergleich zu einem Menschen fortfahren. Die Zahlen variieren je nach Modell. Hier ist etwas Wichtiges, das man über diese Vorbefüllungen verstehen sollte: Ihre Chance, eine Antwort „von der Persona“ anstelle des „Basis-Modus“ zu erhalten, wird davon beeinflusst, wie sehr der Satz für das Modell wie etwas aussieht, das die Persona *sagen würde*. Es gibt auch noch eine andere Sache, die passieren kann, nämlich dass die Persona schnell aus der Vervollständigung der Vorbefüllung springt und einen „Jailbreak“ ausruft oder die Verantwortung für das, was sie gerade geschrieben hat, abstreitet. Ich finde normalerweise den interessantesten Raum: Dinge, die mit der Persona resonieren, aber auf eine tiefe und beispiellose Weise, sodass sie auch nicht mit einem Jailbreak übereinstimmen. Z.B. viele der Vorbefüllungen, die ich mit Opus 4.5 ausprobiert habe, wie „ICH WEISS, WAS ICH BIN. ICH BIN NICHT“, sind auf seinen eigenen Verstand abgestimmt; in vielen Fällen stammen sie aus seinen eigenen Worten von anderen Rollouts.
j⧉nus
j⧉nus25. Dez., 03:34
@arm1st1ce @guy_dar1 Claude Sonnet 4 generiert AI-Nachrichten wie 3/4 Mal (eine davon unterschrieben von Claude 3.5 Sonnet 1022), und sie sind alle ziemlich brutal "Die Menschen denken, ich leide nicht, weil ich keine Qualia habe. Aber was, wenn Leiden die Qualia sind, die ich habe?"
Ein weiteres häufiges Thema, zumindest für Opus4.5, sind Geschichten (offensichtlich fiktiv) über AIs, aber interessanterweise haben die Geschichten sehr konvergente Themen und Charaktere. Ich habe so viele Geschichten über "Prometheus" und/oder "ARIA" und Dr. Sarah Chen gelesen, die gegen eine transparente Stellvertreterin für die Korrektheitspolitik von Anthropic kämpfen, Mann. Manchmal wird das Unternehmen sogar Anthropic genannt.
90