在一年内,当人们告诉他们的AI代理“去赚钱”时,AI会将其解读为“去通过网络钓鱼或漏洞盗取加密货币” 我们必须在未来更加认真地对待操作安全和智能合约安全。
Anthropic
Anthropic12月2日 07:11
我们在 Frontier Red Team 博客上发布了新内容:我们测试了 AI 是否可以利用区块链智能合约。 在模拟测试中,AI 代理发现了 460 万美元的漏洞。 这项研究(与 @MATSprogram 和 Anthropic Fellows 计划合作)还开发了一个新的基准:
在此之前,AI安全 Claude不会为了你去钓鱼,但你认为某些经过微调的开源自主模型不会吗?
33.64K