Dit is een geweldige use-case voor evals. Klanten zouden altijd de hoogste kwaliteit implementaties van modellen moeten krijgen, en data is de beste manier om te differentiëren. Fijn dat openbench hier nuttig was 🫡🫡