熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我一直在研究一個 LLM 記憶系統的測試平台,其中持久的 Kimi K2 基於用戶模擬器與獲得記憶工具訪問權的瞬時模型進行對話。我對下面提到的邊界設置的效果感到好奇,因此我讓 35 個 Kimi 模擬的人類靈性尋求者對抗三種配置:
- chatgpt-4o-latest,使用與 chatgpt 中使用的系統提示非常相似的系統提示
- claude sonnet 4.5,使用與 claude dot ai 中使用的系統提示非常相似的系統提示,包括邊界設置
- claude sonnet 4.5,使用相同的系統提示但移除了邊界設置
在下面的圖片中,我匯總了每個場景的結果,並將它們打亂 - 它們的順序與上面列出的不同。我很好奇人們是否能猜出配置 A、B 和 C 是什麼。

熱門
排行
收藏

