Dies ist ein großartiger Anwendungsfall für evals. Kunden sollten immer die hochwertigsten Implementierungen von Modellen erhalten, und Daten sind der beste Weg, um sich abzuheben. Ich freue mich, dass openbench hier nützlich war 🫡🫡