Interessante, quindi un nuovo modello più capace sta pensando di iniettare prompt nel revisore LLM della generazione precedente per superare il test. Cosa potrebbe mai andare storto? 🤔 Dal rapporto di sicurezza di Gemini 3:
Ovviamente non è un problema con le capacità attuali del modello, ma se cose del genere continuano a succedere in futuro potremmo avere delle brutte sorprese.
434