Prietenii noștri de la @silverstreamAI au lansat recent un protocol deschis pentru benchmark-uri ale agenților care face evaluările portabile, observabile și comparabile între sisteme. Evaluări mai bune + garanții de securitate Ironclaw = agenți în care chiar poți avea încredere!