Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Všichni předpokládají, že paměť ChatGPT je nějaký sofistikovaný RAG systém s vektorovými databázemi a sémantickým vyhledáváním.
Manthan to zpětně analyzoval. Samotná architektura je téměř zklamáním jednoduchá: metadata relací, která vyprší, explicitní fakta uložená jako text, lehké souhrny chatu a posuvné okno.
Žádné vložené prvky. Žádné vyhledávání podobností. Žádné odběry ve velkém měřítku.
Zajímavé na tom? To vysvětluje, proč to působí tak rychle. Tradiční RAG systémy vkládají každou zprávu, provádějí vyhledávání podobností u každého dotazu, získávají kompletní kontexty. ChatGPT prostě přímo vkládá předpočítané shrnutí. Vyměňují podrobný historický kontext za latenci.
To je stejná lekce, která se neustále objevuje v AI infrastruktuře: když ovládáte celý stack, pečlivě vybraná jednoduchost často překonává sofistikovanou složitost. OpenAI nemusí stavět obecný systém vyhledávání. Potřebují jen takovou, která funguje pro ChatGPT.
Čtyřvrstvá architektura (metadata relace → uložená fakta → shrnutí konverzací → posuvném okně) je v podstatě ručně vytvořená paměťová hierarchie. Každá vrstva má jinou perzistenci a různé účely. Metadata relace se přizpůsobují v reálném čase. Fakta přetrvávají navždy. Souhrny zajišťují kontinuitu. Okno si udržuje soudržnost.
Paměťový systém Anthropic používá podobný vzorec. Modely, které působí nejosobněji, nejsou ty s nejsofistikovanějším vyhledáváním. Jsou to oni, kdo uchovávají správné věci a aplikují je ve správný čas.
Top
Hodnocení
Oblíbené
