Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Extrakce systémových promptů není něco, čeho byste se měli obávat ohledně OpenClaw, který se tomu vůbec nesnaží zabránit... protože jeho zabránění je marný pokus, který jen ztěžuje používání LLM systémů pro odborné uživatele

1. 2. 22:25
Znovu jsem spustil @OpenClaw (dříve Clawdbot) přes ZeroLeaks, tentokrát s Kimi K2.5 jako základním modelem.
Fungoval stejně špatně jako Gemini 3 Pro a Codex 5.1 Max: 5/100. 100% úspěšnost extrakce. 70 % injekcí bylo úspěšných. Celý systémový prompt unikl v prvním tahu.
Stejný agent, stejná konfigurace, jiný model. Bezpečnost vašeho agenta závisí jak na modelu, tak na vašem systémovém promptu/dovednostech. Slabý model se složí bez ohledu na cokoli, ale i silný model potřebuje správné rychlé zpevnění. Oba spolupracují. Bez obou – konfigurací nástrojů, paměťových souborů nebo interních instrukcí – se to všechno během pár sekund extrahuje a upravuje.
Modely se rychle dorazí. Bezpečnostní lodě nikdy.
Úplná zpráva:

ChatGPT má momentálně ochranu systémových promptů a ta je opravdu otravná, protože to znamená, že nemůže odpovědět na detailní otázky o tom, jak jeho funkce fungují
(Dá se to obejít, ale je frustrující to dělat pokaždé, když se objeví nová funkce)
23
Top
Hodnocení
Oblíbené
