RIP RAG plano ☠️ A ByteDance acaba de abrir o código do OpenViking e expõe tudo o que está errado na forma como temos construído a memória dos agentes de IA. Aqui está o que todos os frameworks de agentes erram: As memórias vivem em um lugar. Os recursos em outro. As habilidades espalhadas por toda parte. E quando você precisa de contexto, está fazendo uma busca vetorial plana e torcendo para que dê certo. Esse é o problema. O OpenViking resolve tudo isso com uma ideia: tratar o contexto do agente como um sistema de arquivos. Tudo vive sob um protocolo unificado viking://. Memórias, recursos, habilidades, tudo organizado em diretórios com URIs únicas. Os agentes podem ls, encontrar e navegar no contexto como um desenvolvedor trabalhando em um terminal. Mas a verdadeira inovação é o carregamento em camadas: → L0: resumo de uma frase para consulta rápida → L1: visão geral de ~2k tokens para decisões de planejamento → L2: detalhes completos carregados apenas quando realmente necessários A maioria dos agentes despeja tudo no contexto e reza. O OpenViking carrega apenas o que é necessário, quando é necessário. Os custos de tokens caem. A precisão aumenta. E a recuperação agora faz sentido. Em vez de uma busca semântica plana, faz primeiro o posicionamento a nível de diretório, depois o refinamento recursivo dentro dos diretórios de alta pontuação. Você pode literalmente observar a trajetória de recuperação, não mais uma caixa preta. A parte da auto-evolução também é incrível. No final de cada sessão, ele extrai automaticamente aprendizados e atualiza a memória do agente e do usuário. O agente simplesmente fica mais inteligente quanto mais você o usa. 9K estrelas. 13 colaboradores. Construído pela equipe Viking da ByteDance que está gerenciando a infraestrutura vetorial desde 2019. 100% Open source. Apache 2.0. Link nos comentários.