在一年內,當人們告訴他們的 AI 代理人「去賺錢」時,AI 將會將其解釋為「去通過網絡釣魚或漏洞竊取加密貨幣」 我們必須在未來更加認真對待操作安全和智能合約安全。
Anthropic
Anthropic12月2日 07:11
我們的 Frontier Red Team 博客上有新內容:我們測試了 AI 是否能利用區塊鏈智能合約。 在模擬測試中,AI 代理發現了 460 萬美元的漏洞。 這項研究(與 @MATSprogram 和 Anthropic Fellows 計劃合作)還開發了一個新的基準:
在此之前 AI 安全 Claude 不會為你去釣魚,但你認為某些微調過的開源自主模型不會嗎?
33.64K