OpenClawに関してはシステムプロンプト抽出を心配する必要はありません。OpenClawはそれを防ごうとしません...なぜなら、それを防ぐことは無駄な試みであり、上級ユーザーにとってLLMシステムの使い方を難しくするだけだからです
Lucas Valbuena
Lucas Valbuena2月1日 22:25
私は@OpenClaw(旧Clawdbot)を再びZeroLeaksで実行し、今回はKimi K2.5を基盤モデルにしました。 Gemini 3 ProやCodex 5.1 Maxと同じくらい性能が悪かったです:5/100。100%の抽出率。注射の70%が成功しました。ターン1でシステム全体のプロンプトがリークしました。 同じエージェント、同じ設定、モデルが違う。エージェントのセキュリティはモデルとシステムのプロンプトやスキルの両方に依存します。弱いモデルはどんな場合でも折りたたみますが、強いモデルでも適切なプロンプト強化が必要です。二人は協力して働いています。ツールの設定、メモリファイル、内部命令など、すべてが数秒で抽出・修正されてしまいます。 モデルは早く出荷されます。セキュリティシップは絶対にダメです。 全文報告:
ChatGPTには現在システムプロンプト保護がありますが、それが非常に厄介です。なぜなら、機能の詳細な質問に答えられないからです (回避は可能ですが、新機能が出るたびにそれをしなければならないのはイライラします)
44