Nasi przyjaciele z @silverstreamAI niedawno uruchomili otwarty protokół dla benchmarków agentów, który sprawia, że oceny są przenośne, obserwowalne i porównywalne między systemami. Lepsze oceny + gwarancje bezpieczeństwa Ironclaw = agenci, którym naprawdę można zaufać!