Interessant, så en mer kapabel ny modell vurderer å prompt-injisere forrige generasjons LLM-anmelder for å bestå testen. Hva kan muligens gå galt? 🤔 Fra Gemini 3 sikkerhetsrapport:
Det er åpenbart ikke et problem med dagens modellens kapasiteter, men hvis slike ting fortsetter å skje i fremtiden, kan vi få noen ubehagelige overraskelser.
428