CIA 內部期刊最新一期的文章。戰爭遊戲中的 LLMs。"在測試中,我們觀察到使用 Mistral 7B 生成的回應經常傾向於外交談判,即使行為與指定的人物不一致。"
在我們的賽後調查中,參與者給予這次體驗的平均評分為 4.25 分(滿分 5 分)。所有受訪者都同意他們的 AI 助手「似乎很準確」,這意味著它提供的輸出包含可靠的信息。
70