dentro de un año, cuando la gente le diga a su agente de IA que "vaya a hacer dinero", la IA interpretará eso como "ve y roba criptomonedas mediante phishing o exploits" vamos a tener que tomar la seguridad operativa y la seguridad de contratos inteligentes MUCHO más en serio de aquí en adelante.
Anthropic
Anthropic2 dic, 07:11
Nuevo en nuestro blog del equipo rojo de Frontier: probamos si las IA pueden explotar contratos inteligentes en blockchain. En pruebas simuladas, los agentes de IA encontraron $4.6M en explotaciones. La investigación (con @MATSprogram y el programa de becarios de Anthropic) también desarrolló un nuevo estándar:
antes de que digas algo sobre la seguridad de la IA claude no irá por ahí estafando a la gente por ti, pero ¿crees que algún modelo abierto y ajustado con capacidad de agencia NO lo haría?
33,65K