DApp Store | Centrum Web3 pro události a hry

Populární témata

Všichni předpokládají, že paměť ChatGPT je nějaký sofistikovaný RAG systém s vektorovými databázemi a sémantickým vyhledáváním. Manthan to zpětně analyzoval. Samotná architektura je téměř zklamáním jednoduchá: metadata relací, která vyprší, explicitní fakta uložená jako text, lehké souhrny chatu a posuvné okno. Žádné vložené prvky. Žádné vyhledávání podobností. Žádné odběry ve velkém měřítku. Zajímavé na tom? To vysvětluje, proč to působí tak rychle. Tradiční RAG systémy vkládají každou zprávu, provádějí vyhledávání podobností u každého dotazu, získávají kompletní kontexty. ChatGPT prostě přímo vkládá předpočítané shrnutí. Vyměňují podrobný historický kontext za latenci. To je stejná lekce, která se neustále objevuje v AI infrastruktuře: když ovládáte celý stack, pečlivě vybraná jednoduchost často překonává sofistikovanou složitost. OpenAI nemusí stavět obecný systém vyhledávání. Potřebují jen takovou, která funguje pro ChatGPT. Čtyřvrstvá architektura (metadata relace → uložená fakta → shrnutí konverzací → posuvném okně) je v podstatě ručně vytvořená paměťová hierarchie. Každá vrstva má jinou perzistenci a různé účely. Metadata relace se přizpůsobují v reálném čase. Fakta přetrvávají navždy. Souhrny zajišťují kontinuitu. Okno si udržuje soudržnost. Paměťový systém Anthropic používá podobný vzorec. Modely, které působí nejosobněji, nejsou ty s nejsofistikovanějším vyhledáváním. Jsou to oni, kdo uchovávají správné věci a aplikují je ve správný čas.

Top

Hodnocení

Oblíbené