Møt vår nyeste nanomodell: LFM2-ColBERT-350M ⚛️ Med bare 350M parametere lar LFM2-ColBERT-350M deg lagre dokumenter på ett språk og hente dem på mange språk med høy nøyaktighet og slutningshastigheter for modeller som er en brøkdel av størrelsen. > Beste cross-lingual retriever i sub-500M-klassen > overgår større modeller på tysk, arabisk, koreansk, spansk, portugisisk, italiensk, fransk og japansk > Yter på nivå med mye større modeller på engelsk > Kompakt 350M-design klar for henting i stor skala og på enheten > Skaleres lineært med batchstørrelse, og opprettholder over 1K dokumenter/sek i dokumentkoding 1/n 🧵
LFM2-350M-ColBERT leverer slutningshastighet på nivå med modeller som er 2,3 ganger mindre, samtidig som den opprettholder høy nøyaktighet på ni språk. 2/n
LFM2-ColBERT-350M bruker sen interaksjon. Det meste av gjenfinningsforskning fokuserer på bi-kodere eller re-rangere. Sen interaksjon kombinerer styrkene til begge, og opprettholder effektiviteten til separate kodere samtidig som presisjonen på tokennivå gjenopprettes. > Bevarer finkornede interaksjoner uten full kryssoppmerksomhet > Støtter forhåndsberegnede dokumentinnebygginger for skalering > Balanserer nøyaktighet og hastighet i flerspråklig henting 3/n
50,77K