Praca nad oceną opartą na rzeczywistych śladach i wspieranie @langfuse @braintrustdata oraz Langsmith z @LangChainAI była niezwykle ekscytująca. Chcemy pomóc deweloperom ocenić to, co naprawdę ma znaczenie, a nie jakieś akademickie, niezależne benchmarki.