¿Alguna herramienta pública de benchmarking para agentes de auditoría de IA? Sería muy útil poder comparar los productos disponibles Aunque seguro que los MF aprenderán rápido a manipular los benchmarks