I nostri amici di @silverstreamAI hanno recentemente lanciato un protocollo aperto per i benchmark degli agenti che rende le valutazioni portabili, osservabili e comparabili tra i sistemi. Migliori valutazioni + garanzie di sicurezza Ironclaw = agenti di cui puoi davvero fidarti!