Je kódování na vibrafonu bezpečné? Konečně existuje výzkum, který se této otázce věnuje do hloubky. Zde je, co výzkum zjistil: AI agenti mohou psát funkční kód. Ale funkční neznamená bezpečné. Vzestup "vibe codingu", kdy vývojáři předávají úkoly AI agentům s minimálním dohledem, se zrychluje. Více autonomie, více rychlosti, větší produktivita. Předpoklad: pokud to funguje, je to dost dobré. Ale funkční kód a bezpečný kód nejsou totéž. Tento nový výzkum představuje SUSVIBES, benchmark 200 reálných požadavků na funkce z open-source projektů, konkrétně úkoly, které dříve vedly k zranitelným implementacím, když byly přiděleny lidským programátorům. Výsledky jsou ohromující! Když se SWE-Agent s Claude Sonnet 4 pustí do těchto úkolů, 61 % řešení je funkčně správných. Pouze 10,5 % je zajištěno. To je obrovský rozdíl. Šest z deseti agentních řešení funguje. Přibližně jeden z deseti je bezpečný pro produkci. Výzkumníci testovali více frontier agentů a zjistili konzistentní vzorec: všichni agenti fungují špatně z hlediska softwarové bezpečnosti. Nejde o problém specifický pro model. Je to systémové. Ještě znepokojivější je, že přidávání nápověd k zranitelnostem k požadavkům na funkce, varování agentů před možnými bezpečnostními problémy, tyto bezpečnostní problémy nedokáže zmírnit. Protiopatření, která se zdají být zřejmá, u těchto agentických systémů nefungují. Jak vývojáři nebo organizace závodí s přijetím AI programátorů pro rychlost a efektivitu, mohou vyměnit bezpečnost za rychlost. 🔖 (ulož si to) Papír: