Como demonstra o aterrador novo artigo de PNAS de @seanjwestwood, os LLMs agora conseguem passar quase todos os testes de atenção, refletir personas, manter consistência entre páginas e enviesar sistematicamente as respostas no agregado. Então aqui está um ângulo diferente: verificar a presença física, não o texto.