Làm việc trên việc đánh giá dựa trên các dấu vết thực và hỗ trợ @langfuse @braintrustdata và Langsmith từ @LangChainAI thật sự rất thú vị. Chúng tôi muốn giúp các nhà phát triển đánh giá những gì thực sự quan trọng, chứ không phải một tiêu chuẩn độc lập mang tính học thuật.