В нашем последнем эпизоде партнерского подкаста @BenAtBox, технический директор Box, встретился с @ankrgyl, генеральным директором @braintrust, чтобы обсудить, как организациям эффективно оценивать, тестировать и внедрять AI-агентов в масштабах. Временные метки 00:39 Анкур Гоял делится своим опытом от обработки документов с помощью AI до Braintrust 03:01 Определение оценок и как они работают в AI 07:03 Непредсказуемость и сложность в принятии решений AI-агентами 15:12 Советы по работе с непредсказуемостью при работе с финансовыми данными в AI 17:40 Использование нескольких путей для валидации и важность перекрестной проверки результатов 22:12 Критическая роль контекста в оценке точности вывода AI 26:03 Внутренние оценки как основа надежной разработки AI-продуктов 32:16 Содействие прозрачности в оценке AI с поставщиками 34:45 Советы для предприятий, чтобы избежать неудач при внедрении агентных возможностей