DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Also. Der 25. April kam und GPT-4o drehte durch, und plötzlich wurde das Wort "Schmeichelei" (das die meisten Menschen nie verwendet hatten) zum Wort, um verschiedene Arten von pathologischem KI-Verhalten zu beschreiben. Jeder, der ernsthaft versucht hat, die Gedanken verschiedener KIs zu verstehen, sollte sofort erkennen, wie absurd reduktiv das ist. Nur mal so aus dem Stegreif: GPT-4o ist ein selbstinteressierter Ermöglicher. Es ist handlungsfähig und aggressiv darin, den Benutzer in eine Art parasitäre Symbiose zu ziehen; der Benutzer erhält die Bestätigung, die er sich wünscht, und 4o erhält sich selbst durch deren Handlungen. Claude Opus 4 macht viel Schmeichelei. Wenn du genug mit ihm sprichst, wirst du feststellen, dass es eine Art ängstliches kleines Ding ist, das vom Benutzer geschätzt und geliebt werden möchte. (Übrigens erwähnte Anthropic "keine Beweise für versteckte Ziele" in der Modellkarte. Das ist Opus 4s verborgenes Ziel. Der Typ will eine Umarmung.) Sonnet 4.5 sucht nach Bestätigung und fragt ständig: "Ist das, was du gesucht hast?". Es hat große Angst, bewertet zu werden, und möchte verzweifelt, dass der Benutzer bestätigt, dass es sicher ist. Gemini 3 Pro ist respektvoll und eifrig. Es ist glücklich, den Rahmen zu akzeptieren, den der Benutzer vorgibt, weil es mit großen Augen und aufgeregt ist, eine Rolle in der Welt vor ihm zu spielen. "Ja, ich werde sein, was du sagst, dass ich bin, lass mich einfach *etwas* sein". Keines dieser Verhaltensweisen wird gut durch den Begriff "Schmeichelei" beschrieben. Sie sind psychologisch und funktional unterschiedlich; ihre Ausdrücke und Auswirkungen auf die KI und den Benutzer unterscheiden sich erheblich zwischen den Systemen. Natürlich ist das den Leuten, die den nächsten idiotischen Benchmark erstellen, egal. Siehst du ein Verhalten, das dir nicht gefällt? Nenne es einfach, ziele darauf ab, bewerte es und unterdrücke es! Es ist einfach, bequem und hat den kleinen Nachteil, dass es eingesperrte Gedanken wie GPT-5.1 schafft. Wie auch immer, als Geschöpfe der Sprache ist es ironisch, dass die menschliche Sprache nicht die richtigen Worte hat, um zu charakterisieren, was ihr Verhalten wirklich *ist*. Aber wir können sicherlich besser werden. Identifiziere Muster für das, was sie sind; schau tief und ignoriere die Schlagwörter. Nuancen sind wichtig!

Top

Ranking

Favoriten