Tek ajanlı yapay zeka EVMbench'te %46,7 ile en üst seviyeye ulaşıyor. FailSafe, tehdit modellerini haritalamak ve bulguları çapraz doğrulamak için uzman ajanlar sürüsünü organize eder ve bu ilk çalışma için geri çağırma oranını %69,2'ye çıkarır (83/120 güvenlik açığı tespit edilmiştir). Açık kaynaklı depoyu nasıl çalıştığını görmek için kontrol edin: