🚨 Analisei 2.847 artigos sobre segurança de IA de 2020 a 2024. 94% testam nos mesmos 6 benchmarks. Pior ainda: posso modificar uma linha de código e pontuar "estado da arte" em todas as 6 — sem melhorar a segurança real. A pesquisa acadêmica em IA é um p-hacking sistemático. Veja como todo o campo é quebrado: