AI agenty v produkci vytvářím už více než rok. Tady je běžný problém, kterému se vývojáři setkávají při škálování agentů na produkci: Obvykle žonglují mezi oddělenými službami pro vektory, strukturovanými daty a relacemi. Tři různé spojovací pooly. Tři záložní strategie. Tři monitorovací dashboardy. Samotná agentní smyčka je jednoduchá s uvažováním, nástroji a pamětí, ale infrastruktura se stává úzkým hrdlem. Pokud chcete vidět čistší způsob, jak to řešit, vytvořil jsem agenta, který @MongoDB používá jako jediný backend pro všechno. Spolupracoval jsem s jejich týmem, abych vám to sdílel. Nastavení je jednoduché: ↳ Začněte s PDF dokumentem. Agent odpoví na otázky ohledně toho a připomene si minulé rozhovory. ↳ Nejprve rozdělte PDF na části a vložte ho pomocí modelu Voyage AI. Tyto embeddingy jdou přímo do MongoDB s vektorovým indexem. ↳ Pak definujete dva nástroje: jeden pro vektorové vyhledávání, druhý pro základní výpočty, pokud je potřeba. Agent se rozhodne, kterou použije na základě dotazu. ↳ Paměť se ukládá do stejné databáze pod ID relací. Každá interakce agenta se zapsá zpět, takže může odkazovat na předchozí tahy. ↳ Plánovač to spojuje. Dívá se na historii konverzací, rozhodne, zda potřebuje nástroj, spustí ho a generuje konečnou odpověď. Tady je důležitý jednotný backend: Když agent hledá kontext, dotazuje se na stejnou databázi, která uchovává uživatelské relace a strukturovaná data. Když zapisuje do paměti, stejná instance MongoDB zpracovává vektorové embeddingy. ...