有趣,所以一個更強大的新模型正在考慮對前一代 LLM 評審進行提示注入以通過測試。可能會出現什麼問題呢? 🤔 來自 Gemini 3 安全報告:
顯然這不是目前模型能力的問題,但如果未來這種情況持續發生,我們可能會遇到一些令人不快的驚喜。
429