Interesante, así que un modelo nuevo más capaz está pensando en inyectar prompt al revisor de LLM de generación anterior para que pase la prueba. ¿Qué podría salir mal? 🤔 Del informe de seguridad Gemini 3:
Obviamente no es un problema con las capacidades actuales del modelo, pero si cosas así siguen ocurriendo en el futuro, podríamos tener sorpresas desagradables.
440