🚨 Ik heb 2.847 AI-veiligheidspapieren geanalyseerd van 2020-2024. 94% test op dezelfde 6 benchmarks. Erger: Ik kan één regel code aanpassen en "state-of-the-art" scoren op alle 6—zonder de werkelijke veiligheid te verbeteren. Academisch AI-onderzoek is systematisch p-hacking. Dit is hoe het hele veld kapot is: