Це чудовий варіант використання для evals. Клієнти завжди повинні отримувати найвищу якість реалізації моделей, а дані є найкращим способом диференціації. Радий, що тут 🫡🫡 став у нагоді OpenBench