Incontra il nostro nuovo modello nano: LFM2-ColBERT-350M ⚛️ Con solo 350M di parametri, LFM2-ColBERT-350M ti consente di memorizzare documenti in una lingua e recuperarli in molte lingue con alta precisione e velocità di inferenza di modelli di una frazione delle sue dimensioni. > Miglior recuperatore cross-lingua nella classe sotto i 500M > Supera modelli più grandi in tedesco, arabo, coreano, spagnolo, portoghese, italiano, francese e giapponese > Si comporta alla pari con modelli molto più grandi in inglese > Design compatto da 350M pronto per il recupero su larga scala e su dispositivo > Scala linearmente con la dimensione del batch, sostenendo oltre 1K documenti/sec nella codifica dei documenti 1/n 🧵
LFM2-350M-ColBERT offre una velocità di inferenza paragonabile a modelli 2,3 volte più piccoli, mantenendo un'alta precisione in nove lingue. 2/n
LFM2-ColBERT-350M utilizza l'interazione tardiva. La maggior parte della ricerca sul recupero si concentra su bi-encoder o re-ranker. L'interazione tardiva combina i punti di forza di entrambi, mantenendo l'efficienza di encoder separati mentre ripristina la precisione a livello di token. > Preserva interazioni dettagliate senza attenzione incrociata completa > Supporta embedding di documenti pre-calcolati per la scalabilità > Bilancia accuratezza e velocità nel recupero multilingue 3/n
50,77K