🚨 Jag analyserade 2 847 AI-säkerhetsartiklar från 2020 till 2024. 94% testar på samma 6 benchmarks. Värre: Jag kan ändra en rad kod och få "state-of-the-art" på alla sex – utan att förbättra den faktiska säkerheten. Akademisk AI-forskning är systematisk p-hacking. Så här bryts hela fältet upp: