DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Twee op de drie kwetsbaarheden met hoge ernst op EVMBench gedetecteerd door AuditAgent. Voordat er een handmatige beoordeling zou beginnen. EVMBench is een gestandaardiseerde benchmark voor AI-kwetsbaarhedendetectie, gebouwd door @OpenAI. We hebben alle 40 repos uitgevoerd. AuditAgent: 80/120 (67%). Beste basismodel: 56/120 (47%). Geen repos overgeslagen, uitgevoerd in volgorde. Recall is één dimensie. We evalueren op zowel recall als precisie, en we hebben onze evaluatiemethodologie open-source gemaakt. Volledige analyse volgt.

Boven

Positie

Favorieten