Vila i frid, flat RAG ☠️ ByteDance har precis öppnat OpenViking och det avslöjar allt som är fel med hur vi har byggt AI-agentminne. Här är vad varje agentramverk gör fel: Minnen finns på ett ställe. Resurser i en annan. Färdigheter utspridda överallt. Och när du behöver kontext gör du flat vector search och hoppas på det bästa. Det är problemet. OpenViking löser allt med en idé: behandla agentens kontext som ett filsystem. Allt lever under ett enhetligt viking:// protokoll. Minnen, resurser, färdigheter – allt organiserat i kataloger med unika URI:er. Agenter kan LS:a, hitta och navigera i kontext som en utvecklare som arbetar vid en terminal. Men det verkliga genombrottet är nivådelad laddning: → L0: ett enmeningsabstrakt för snabb uppslagning → L1: ~2k tokenöversikt för planeringsbeslut → L2: fullständiga detaljer laddas endast när det faktiskt behövs De flesta agenter sätter allt i sitt sammanhang och ber. OpenViking laddar bara det som behövs, när det behövs. Tokenkostnaderna minskar. Noggrannheten ökar. Och hämtning är faktiskt logiskt nu. Istället för en platt semantisk sökning gör den först placering på katalognivå, sedan rekursiv förfining i highscore-kataloger. Du kan bokstavligen titta på återhämtningsbanan, inte längre svart låda. Självutvecklingsdelen är också galen. I slutet av varje session extraherar den automatiskt inlärningen och uppdaterar agent- och användarminnet. Agenten blir bara smartare ju mer du använder det. 9 000 stjärnor. 13 bidragsgivare. Byggt av ByteDance Viking-teamet som har kört vektorinfrastruktur sedan 2019. 100 % öppen källkod. Apache 2.0. Länk i kommentarerna.