Acesta este un caz de utilizare minunat pentru evals. Clienții ar trebui să obțină întotdeauna implementări de modele de cea mai înaltă calitate, iar datele sunt cea mai bună modalitate de a diferenția. Mă bucur că Openbench a fost util aici 🫡🫡