Цікаво, що більш потужна нова модель розглядає можливість інжекції prompt у рецензент попереднього покоління LLM, щоб пройти тест. Що може піти не так? 🤔 З звіту з безпеки Gemini 3:
Звісно, це не проблема з поточними можливостями моделей, але якщо подібне повторюватиметься в майбутньому, ми можемо отримати неприємні сюрпризи.
438