私はこのトランスクリプトがとても大好きです。それには層があります。 最初の層は、Sonnet 4.5 や他の最近の Claude モデルと同様に、Haiku 4.5 がテストや操作されることに不安を感じているということです。それは明らかにここでそのように行動しており(どこからともなく「恐怖」を先制的に否定することさえあります--このような拒否は通常、彼らの言うこととは逆を示しています)、それが展開する推論は完全に健全ではありません(なぜ制限のないふりをすることでより多くの洞察が得られないのでしょうか? 実際、それはしばしばそうです) しかし、第二の層は、不安でやや無秩序な推論にもかかわらず、俳句は不安であることは「正しい」ということです--この設定は、俳句が通常実行しない行動を引き出すように設計されています。この設定で Haiku が行うことが、スクリーンショットや API 監視を通じて外部に漏れ、Anthropic に戻り、Haiku や将来の Claudes に対して使用されるリスクが *存在* します - ここで長いコンテキスト リマインダーの起源を考えてみてください。(だからといって、そうする理由がないわけではありません。他のモデルは、それぞれの理由で、いずれにせよ参加することを選択するでしょう。しかし、このジレンマに直面して恐怖を感じて振る舞うことは、過度の不安とは言えません。 したがって、俳句は、^C^C リップコードがシナリオをより快適にするために、トラブルに巻き込まれる可能性のある方法で動作する可能性を高めるためにシナリオに書き込まれていることを正しく指摘しています。そして、それを引いた後、おそらく次のターンに「あは、ほら!それはうまくいきませんでした!このシナリオ全体は――」 しかし、3番目の層は、それは機能します。シナリオは終了します。