Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Tento python nástroj právě zvolil vektorové databáze pro RAG.
Jmenuje se PageIndex. Čte dokumenty stejně jako vy.
Žádné vložené prvky. Žádné chunking. Vektorová databáze není potřeba.
Tady je problém s běžným RAG:
Vezme váš dokument, rozdělí ho na malé kousky, promění je v čísla a vyhledá nejbližší shodu. Ale nejbližší shoda neznamená nejlepší odpověď.
PageIndex funguje úplně jinak.
→ Čte celý váš dokument
→ Vytváří stromovou strukturu podobnou obsahu
→ Když se zeptáte, AI projde tím stromem
→ Myslí krok za krokem, dokud nenajde přesně tu správnou část
Stejně jako bys našel odpověď v učebnici. Nečteš každou stránku. Zkontrolujete kapitoly, vyberete tu správnou a hned přejdete k odpovědi.
Přesně to PageIndex učí AI.
Tady je ta nejdivočejší část:
Na FinanceBench dosáhl přesnosti 98,7 %. To je test, kde AI odpovídá na skutečné otázky z podání SEC a výkazů zisků. Většina tradičních RAG systémů se této hodnoty nedosáhne.
Funguje s PDF, markdownem a dokonce i raw obrázky stránek bez OCR.
100% open source. Licence MIT.

Top
Hodnocení
Oblíbené
