Seznamte se s naším nejnovějším nano modelem: LFM2-ColBERT-350M ⚛️ Při pouhých 350M parametrech vám LFM2-ColBERT-350M umožňuje ukládat dokumenty v jednom jazyce a načítat je v mnoha jazycích s vysokou přesností a rychlostí odvozování modelů o zlomku jejich velikosti. > Nejlepší mezijazykový retrívr ve třídě do 500 milionů > překonává větší modely v němčině, arabštině, korejštině, španělštině, portugalštině, italštině, francouzštině a japonštině > V angličtině se vyrovná mnohem větším modelům > Kompaktní 350M design připravený pro rozsáhlé vyhledávání a načítání na zařízení > Lineárně se škáluje s velikostí dávky a udržuje více než 1 tisíc dokumentů za sekundu v kódování dokumentu 1/n 🧵
LFM2-350M-ColBERT poskytuje rychlost inference srovnatelnou s modely 2,3x menšími, a to při zachování vysoké přesnosti v devíti jazycích. 2/N
LFM2-ColBERT-350M využívá pozdní interakce. Většina výzkumu vyhledávání se zaměřuje na bi-kodéry nebo re-rankery. Pozdní interakce kombinuje silné stránky obou, zachovává efektivitu samostatných kodérů a zároveň obnovuje přesnost na úrovni tokenu. > Zachovává jemné interakce bez plné křížové pozornosti > Podporuje vkládání předem vypočítaných dokumentů pro změnu měřítka > Vyvažuje přesnost a rychlost vícejazyčného vyhledávání 3/n
50,77K