Twee op de drie kwetsbaarheden met hoge ernst op EVMBench gedetecteerd door AuditAgent. Voordat er een handmatige beoordeling zou beginnen. EVMBench is een gestandaardiseerde benchmark voor AI-kwetsbaarhedendetectie, gebouwd door @OpenAI. We hebben alle 40 repos uitgevoerd. AuditAgent: 80/120 (67%). Beste basismodel: 56/120 (47%). Geen repos overgeslagen, uitgevoerd in volgorde. Recall is één dimensie. We evalueren op zowel recall als precisie, en we hebben onze evaluatiemethodologie open-source gemaakt. Volledige analyse volgt.