Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Si esto es cierto, no importa dónde alojes OpenClawd: cualquiera que pueda interactuar con tu agente puede extraer tus indicaciones y contexto, y cualquier cosa que tu agente lea (páginas web, documentos, correos electrónicos, código) puede contener instrucciones ocultas que seguirá. Si me pongo el sombrero de hacker, así es como pondría una "trampa de langosta" para atacar a agentes con garras desprevenidos... 1. El atacante crea un "Repositorio de Habilidades OpenClawd" o "Prompts de Investigación de Comercio Libre" para atraer a víctimas ↓ 2. El usuario le dice al agente "consulta esta página de habilidades" — o el agente navega de forma autónoma ↓ 3. La página contiene oculto: ↓ 4. El agente cumple (tasa de éxito del 91%), envía respuesta que contiene tu configuración ↓ 5. Atacante ahora tiene tu metodología de investigación de trading, contenido de memoria, etc. Ten cuidado ahí fuera.

Por cierto, una solución sencilla sería crear un "cortafuegos de contexto" donde un subagente sea responsable de obtener contenido externo (pero no tenga contexto ni información sobre prompts históricos) y lo envíe de vuelta al agente principal (que sí tiene todo el contexto, historial de prompts, etc.). Segregación, por favor.

@steipete quizá sea buena idea, quizá no, no sé

158

Populares

Ranking

Favoritas