Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Buduję agentów AI w produkcji od ponad roku.
Oto powszechny problem, z którym borykają się deweloperzy, gdy skalują agentów do produkcji:
Zazwyczaj balansują między oddzielnymi usługami dla wektorów, danych strukturalnych i sesji.
Trzy różne pule połączeń. Trzy strategie zapasowe. Trzy pulpity monitorujące.
Pętla agenta sama w sobie jest prosta z rozumowaniem, narzędziami i pamięcią, ale infrastruktura staje się wąskim gardłem.
Jeśli chcesz zobaczyć czystszy sposób na obsługę tego, zbudowałem agenta używając @MongoDB jako jednego backendu dla wszystkiego. Współpracowałem z ich zespołem, aby podzielić się tym z tobą.
Konfiguracja jest prosta:
↳ Zacznij od dokumentu PDF. Agent odpowie na pytania dotyczące tego dokumentu, pamiętając wcześniejsze rozmowy.
↳ Najpierw podziel PDF na fragmenty i osadź go używając modelu Voyage AI. Te osadzenia trafiają bezpośrednio do MongoDB z indeksem wektorowym.
↳ Następnie definiujesz dwa narzędzia: jedno do wyszukiwania wektorowego, drugie do podstawowych obliczeń, jeśli zajdzie taka potrzeba. Agent decyduje, które z nich użyć w zależności od zapytania.
↳ Pamięć jest przechowywana w tej samej bazie danych pod identyfikatorami sesji. Każda interakcja agenta jest zapisywana, aby mógł odwołać się do wcześniejszych tur.
↳ Planista łączy to wszystko. Patrzy na historię rozmowy, decyduje, czy potrzebuje narzędzia, wykonuje to narzędzie i generuje ostateczną odpowiedź.
Oto, dlaczego zjednoczony backend ma znaczenie:
Gdy agent szuka kontekstu, zapytuje tę samą bazę danych, która przechowuje sesje użytkowników i dane strukturalne.
Gdy zapisuje w pamięci, ta sama instancja MongoDB obsługuje osadzenia wektorowe.
...
Najlepsze
Ranking
Ulubione
