V naší nejnovější epizodě partnerského podcastu si @BenAtBox, CTO společnosti Box, povídal s @ankrgyl, generálním ředitelem @braintrust, aby prozkoumali, jak mohou organizace efektivně hodnotit, testovat a nasazovat AI agenty ve velkém měřítku. Časová razítka 00:39 Ankur Goyal sdílí svou cestu od AI zpracování dokumentů až po Braintrust 03:01 Definování hodnocení a jak fungují v AI 07:03 Nedeterminismus a složitost v rozhodování AI agentů 15:12 Rady pro zvládání nedeterminismu při práci s finančními daty v AI 17:40 Použití více cest pro validaci a důležitost křížové kontroly výsledků 22:12 Klíčová role kontextu při hodnocení přesnosti výstupů AI 26:03 Interní hodnocení jako základ spolehlivého vývoje AI produktů 32:16 Podpora transparentnosti v hodnocení AI u dodavatelů 34:45 Rady pro podniky, jak se vyhnout selhání při nasazování agentických schopností