我一直在研究一個 LLM 記憶系統的測試平台,其中持久的 Kimi K2 基於用戶模擬器與獲得記憶工具訪問權的瞬時模型進行對話。我對下面提到的邊界設置的效果感到好奇,因此我讓 35 個 Kimi 模擬的人類靈性尋求者對抗三種配置: - chatgpt-4o-latest,使用與 chatgpt 中使用的系統提示非常相似的系統提示 - claude sonnet 4.5,使用與 claude dot ai 中使用的系統提示非常相似的系統提示,包括邊界設置 - claude sonnet 4.5,使用相同的系統提示但移除了邊界設置 在下面的圖片中,我匯總了每個場景的結果,並將它們打亂 - 它們的順序與上面列出的不同。我很好奇人們是否能猜出配置 A、B 和 C 是什麼。