Dette er en fantastisk brukssak for evals. Kunder skal alltid få implementeringer av modeller av høyeste kvalitet, og data er den beste måten å differensiere på. Glad for at Openbench var nyttig her 🫡🫡