Я разрабатываю AI-агентов в производственной среде уже более года. Вот распространенная проблема, с которой сталкиваются разработчики, когда они масштабируют агентов для производства: Они обычно балансируют между отдельными сервисами для векторов, структурированных данных и сессий. Три разных пула соединений. Три стратегии резервного копирования. Три панели мониторинга. Цикл агента сам по себе прост с рассуждениями, инструментами и памятью, но инфраструктура становится узким местом. Если вы хотите увидеть более чистый способ решения этой проблемы, я создал агента, использующего @MongoDB в качестве единого бэкенда для всего. Я работал с их командой, чтобы поделиться этим с вами. Настройка проста: ↳ Начните с PDF-документа. Агент будет отвечать на вопросы о нем, запоминая прошлые разговоры. ↳ Сначала разбейте PDF на части и внедрите его с помощью модели Voyage AI. Эти встраивания идут прямо в MongoDB с векторным индексом. ↳ Затем вы определяете два инструмента: один для векторного поиска, другой для базовых расчетов, если это необходимо. Агент решает, какой использовать, исходя из запроса. ↳ Память хранится в той же базе данных под идентификаторами сессий. Каждое взаимодействие агента записывается обратно, чтобы он мог ссылаться на предыдущие этапы. ↳ Планировщик связывает все это вместе. Он смотрит на историю разговоров, решает, нужен ли инструмент, выполняет этот инструмент и генерирует окончательный ответ. Вот где важен унифицированный бэкенд: Когда агент ищет контекст, он запрашивает ту же базу данных, которая хранит пользовательские сессии и структурированные данные. Когда он записывает в память, тот же экземпляр MongoDB обрабатывает векторные встраивания. ...