Voit nyt ajaa huippuluokan upotuksia suorittimilla. Uusi tislausmenetelmä toimitettiin juuri, ja siinä on 96 prosenttia opettajien laadusta jopa 15× pienemmässä koossa. Leafredducesin upotuskustannukset ilman menetystä LEAF tulee MongoDB Researchilta ja kohdistuu upotusmalleihin, ei generaattoreihin. Se tiivistää suuren mallin kompaktiksi samalla vektoriavaruudella. Se käyttää epäsymmetristä palautusrakennetta Asiakirjat upotetaan kerran suurella mallilla. Kyselyt upotetaan ajonaikaisesti pienellä sovelluksella. • Yksi offline-työ miljardeille asiakirjoille • Nopeat kyselyt suorittimilla tai reunalaitteilla • Ei uudelleenindeksointia, kun mallit muuttuvat Tulokset ovat kovia lukuja Se säilyttää ~96 prosenttia opettajien suorituskyvystä. Mallit ovat 5×–15× pienempiä ja jopa 24× nopeampia. Parhaat sijoitukset BEIR:ssä ja MTEB:ssä kompakteissa kooissa. Tämä mahdollistaa semanttisen haun, RAG:n ja klusteroinnin suorittamisen matalalla viiveellä, vähäisellä muistilla ja ilman näytönohjainta.