Como demuestra el aterrador nuevo artículo de PNAS de @seanjwestwood, los LLMs ahora pueden superar casi todas las comprobaciones de atención, reflejar personalidades, mantenerse consistentes entre páginas y sesgar sistemáticamente las respuestas en conjunto. Así que aquí va otro ángulo: verifica la presencia física, no el texto.