🚨 Ich habe 2.847 AI-Sicherheitsarbeiten aus den Jahren 2020-2024 analysiert. 94% testen auf denselben 6 Benchmarks. Schlimmer: Ich kann eine Zeile Code ändern und "State-of-the-Art" auf allen 6 erreichen – ohne die tatsächliche Sicherheit zu verbessern. Akademische AI-Forschung ist systematisches p-Hacking. So ist das gesamte Feld kaputt: