Работа над оценкой на основе реальных данных и поддержка @langfuse @braintrustdata и Langsmith от @LangChainAI была невероятно увлекательной. Мы хотим помочь разработчикам оценивать то, что действительно имеет значение, а не какие-то академические отдельные бенчмарки.