Toto je úžasný případ použití pro evals. Zákazníci by měli vždy získat implementaci modelů v nejvyšší kvalitě a data jsou nejlepším způsobem, jak se odlišit. Jsem rád, že OpenBench byl užitečný 🫡🫡