Artık CPU'larda son teknoloji gömmeleri çalıştırabilirsiniz. Yeni bir damıtma yöntemi, öğretmen kalitesinin %96'sını 15× daha küçük boyutta içeren yeni bir yöntem olarak piyasaya sürüldü. Yaprak kırıntıları gömme maliyetlerini kayıpsız LEAF, MongoDB Research'ten geliyor ve üreteçleri değil, göme modellerini hedefliyor. Aynı vektör uzayını koruyarak büyük bir modeli kompakt bir modele damıtıyor. Assimetrik bir geri alma tasarımı kullanır Belgeler büyük model kullanılarak gömülür. Sorgular, küçük olan kullanılarak çalışma zamanında gömülür. • Milyarlarca belge için bir çevrimdışı iş • CPU'lar veya kenar cihazlarda hızlı sorgular • Modeller değiştiğinde yeniden indeksleme yok Sonuçlar kesin rakamlar Öğretmen performansının ~%96'sını koruyor. Modeller 5×–15× daha küçük ve 24× kadar hızlıdır. Kompakt boyutlar için BEIR ve MTEB'de en üst sıralamalar. Bu, düşük gecikme, düşük bellek ve GPU olmadan semantik arama, RAG ve kümeleme işlemlerini çalıştırmanıza olanak tanır.