Jag har byggt AI-agenter i produktion i över ett år. Här är ett vanligt problem utvecklare stöter på när de skalar agenter till produktion: De jonglerar vanligtvis mellan separata tjänster för vektorer, strukturerad data och sessioner. Tre olika anslutningspooler. Tre reservstrategier. Tre övervakningsinstrumentpaneler. Agentloopen i sig är enkel med resonemang, verktyg och minne, men infrastrukturen blir flaskhalsen. Om du vill se ett renare sätt att hantera detta, har jag byggt en agent där @MongoDB är den enda backend för allt. Jag arbetade med deras team för att dela detta med dig. Upplägget är enkelt: ↳ Börja med ett PDF-dokument. Agenten svarar på frågor om det samtidigt som hen minns tidigare samtal. ↳ Först, chunk PDF:en och bädda in den med Voyage AI:s modell. Dessa inbäddningar går direkt in i MongoDB med ett vektorindex. ↳ Sedan definierar du två verktyg: ett för vektorsökning, ett för grundläggande beräkningar om det behövs. Agenten bestämmer vilken som ska användas baserat på frågan. ↳ Minnet lagras i samma databas under sessions-ID:n. Varje interaktion agenten har skrivs tillbaka, så att den kan referera till tidigare turer. ↳ Planeraren binder ihop det. Den tittar på konversationshistoriken, avgör om den behöver ett verktyg, kör det verktyget och genererar det slutgiltiga svaret. Här är det där den enhetliga backenden spelar roll: När agenten söker efter kontext söker den samma databas som lagrar användarsessioner och strukturerad data. När den skriver till minnet hanterar samma MongoDB-instans vektorinbäddningarna. ...