To świetny przypadek użycia dla evals. Klienci powinni zawsze otrzymywać najwyższej jakości implementacje modeli, a dane są najlepszym sposobem na wyróżnienie się. Cieszę się, że openbench był tutaj przydatny 🫡🫡