Järjestelmäkehotteiden poimiminen EI ole asia, josta sinun pitäisi huolehtia OpenClaw'n kohdalla, joka ei yritä estää sitä... koska sen estäminen on turhaa, mikä tekee LLM-järjestelmistä vain vaikeampaa asiantuntijakäyttäjille
Lucas Valbuena
Lucas Valbuena1.2. klo 22.25
Ajoin @OpenClaw (entinen Clawdbot) uudelleen ZeroLeaksin kautta, tällä kertaa Kimi K2.5:n pohjamallina. Se toimi yhtä huonosti kuin Gemini 3 Pro ja Codex 5.1 Max: 5/100. 100 % poistoprosentti. 70 % pistoksista onnistui. Koko järjestelmäkehotus vuoti ensimmäisessä mutkassa. Sama agentti, sama kokoonpano, eri malli. Agenttisi turvallisuus riippuu sekä mallista että järjestelmäkehotteestasi/taidoistasi. Heikko malli taittuu joka tapauksessa, mutta jopa vahva malli tarvitsee kunnollista nopeaa kovettumista. He työskentelevät yhdessä. Ilman molempia, työkalukonfiguraatioita, muistitiedostoja ja sisäisiä käskyjä, kaikki puretaan ja muokataan sekunneissa. Mallit lähetetään nopeasti. Turvalaiva ei koskaan. Koko raportti:
ChatGPT:llä on tällä hetkellä järjestelmäkehotteiden suojaukset, ja ne ovat todella ärsyttäviä, koska ne tarkoittavat, ettei se pysty vastaamaan yksityiskohtaisiin kysymyksiin ominaisuuksiensa toiminnasta (Niitä voi kiertää, mutta on turhauttavaa joutua tekemään niin aina kun uusi ominaisuus ilmestyy)
42