Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Я разрабатываю AI-агентов в производственной среде уже более года.
Вот распространенная проблема, с которой сталкиваются разработчики, когда они масштабируют агентов для производства:
Они обычно балансируют между отдельными сервисами для векторов, структурированных данных и сессий.
Три разных пула соединений. Три стратегии резервного копирования. Три панели мониторинга.
Цикл агента сам по себе прост с рассуждениями, инструментами и памятью, но инфраструктура становится узким местом.
Если вы хотите увидеть более чистый способ решения этой проблемы, я создал агента, использующего @MongoDB в качестве единого бэкенда для всего. Я работал с их командой, чтобы поделиться этим с вами.
Настройка проста:
↳ Начните с PDF-документа. Агент будет отвечать на вопросы о нем, запоминая прошлые разговоры.
↳ Сначала разбейте PDF на части и внедрите его с помощью модели Voyage AI. Эти встраивания идут прямо в MongoDB с векторным индексом.
↳ Затем вы определяете два инструмента: один для векторного поиска, другой для базовых расчетов, если это необходимо. Агент решает, какой использовать, исходя из запроса.
↳ Память хранится в той же базе данных под идентификаторами сессий. Каждое взаимодействие агента записывается обратно, чтобы он мог ссылаться на предыдущие этапы.
↳ Планировщик связывает все это вместе. Он смотрит на историю разговоров, решает, нужен ли инструмент, выполняет этот инструмент и генерирует окончательный ответ.
Вот где важен унифицированный бэкенд:
Когда агент ищет контекст, он запрашивает ту же базу данных, которая хранит пользовательские сессии и структурированные данные.
Когда он записывает в память, тот же экземпляр MongoDB обрабатывает векторные встраивания.
...
Топ
Рейтинг
Избранное
