Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Esta ferramenta Python acabou de tornar os bancos de dados vetoriais opcionais para RAG.
Chama-se PageIndex. Lê documentos da mesma forma que você.
Sem embeddings. Sem fragmentação. Sem necessidade de banco de dados vetorial.
Aqui está o problema com o RAG normal:
Ele pega seu documento, corta-o em pedaços minúsculos, transforma esses pedaços em números e procura a correspondência mais próxima. Mas a correspondência mais próxima não significa a melhor resposta.
O PageIndex funciona de forma completamente diferente.
→ Lê seu documento completo
→ Constrói uma estrutura em árvore como um índice
→ Quando você faz uma pergunta, a IA percorre essa árvore
→ Ela pensa passo a passo até encontrar a seção exata
Da mesma forma que você encontraria uma resposta em um livro didático. Você não lê cada página. Você verifica os capítulos, escolhe o certo e vai direto para a resposta.
É exatamente isso que o PageIndex ensina a IA a fazer.
Aqui está a parte mais impressionante:
Ele obteve 98,7% de precisão no FinanceBench. Esse é um teste onde a IA responde a perguntas reais de documentos da SEC e relatórios de lucros. A maioria dos sistemas RAG tradicionais não consegue alcançar esse número.
Funciona com PDFs, markdown e até mesmo imagens de páginas brutas sem OCR.
100% Open Source. Licença MIT.

Top
Classificação
Favoritos
