機器人令人難以置信,直到一次錯誤的揮動把你的牙齒打掉。而且……我喜歡我的牙齒。🦷 這就是為什麼 RoboSafe 是一個改變遊戲規則的產品。研究人員揭示了一個新的安全框架,旨在在身體傷害發生之前阻止它。它本質上是一個針對物理世界的實時 "護欄"。 與靜態代碼不同,RoboSafe 與代理一起運行,通過兩個互補的步驟評估每一個動作: - 反向推理:它檢測最近行為中的不安全模式或趨勢。 - 前向推理:它根據上下文預測下一個動作是否會越過危險閾值。 它理解 "安全" 是情境性的。打開微波爐是可以的,除非裡面有金屬手錶。 在測試中,RoboSafe 將危險行為減少了約 37%,而不影響代理的生產力。 要點是我們需要停止交叉手指,希望 AI "表現良好"。 真正的安全意味著接受代理是不可預測的,並建立假設它們會失敗的系統。 護欄 > 良好的意圖。🤖🛡️