熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
機器人令人難以置信,直到一次錯誤的揮動把你的牙齒打掉。而且……我喜歡我的牙齒。🦷
這就是為什麼 RoboSafe 是一個改變遊戲規則的產品。研究人員揭示了一個新的安全框架,旨在在身體傷害發生之前阻止它。它本質上是一個針對物理世界的實時 "護欄"。
與靜態代碼不同,RoboSafe 與代理一起運行,通過兩個互補的步驟評估每一個動作:
- 反向推理:它檢測最近行為中的不安全模式或趨勢。
- 前向推理:它根據上下文預測下一個動作是否會越過危險閾值。
它理解 "安全" 是情境性的。打開微波爐是可以的,除非裡面有金屬手錶。
在測試中,RoboSafe 將危險行為減少了約 37%,而不影響代理的生產力。
要點是我們需要停止交叉手指,希望 AI "表現良好"。
真正的安全意味著接受代理是不可預測的,並建立假設它們會失敗的系統。
護欄 > 良好的意圖。🤖🛡️

熱門
排行
收藏
