Este es un caso de uso increíble para evals. Los clientes siempre deberían obtener las implementaciones de modelos de la más alta calidad, y los datos son la mejor manera de diferenciarse. Me alegra que openbench haya sido útil aquí 🫡🫡