OpenAI właśnie nabyło Promptfoo, główne narzędzie open-source do red-teamingu LLM-ów. Jutro publikuję moje badania dotyczące obejścia PromptGuard. 12/18 wektorów ataku zostało pominiętych. 66,7% wskaźnik obejścia na ich żywym API. Pełne opracowanie. Bezpieczeństwo AI staje się poważne. Większość produktów nie jest na to gotowa.