يمكنك الآن تشغيل التضمينات الحديثة على المعالجات. تم شحن طريقة تقطير جديدة بجودة 96 بالمئة من جودة المعلم بحجم أصغر يصل إلى 15× حجم. تكاليف تضمين Leafredduces دون خسارة يأتي LEAF من أبحاث MongoDB ويستهدف نماذج التضمين، وليس المولدات. يقوم بتقطير نموذج كبير إلى نموذج مضغوط مع الحفاظ على نفس مساحة المتجه. يستخدم تصميم استرجاع غير متماثل يتم تضمين المستندات مرة واحدة باستخدام النموذج الكبير. يتم تضمين الاستعلامات أثناء التشغيل باستخدام الصغير (الصغير). • وظيفة واحدة غير متصلة بالإنترنت لمليارات الوثائق • استعلامات سريعة على وحدات المعالجة المركزية أو الأجهزة الطرفية • لا إعادة فهرسة عند تغيير النماذج النتائج أرقام دقيقة يحافظ على ~96 بالمئة من أداء المعلمين. النماذج أصغر بمقدار 5×–15× وأسرع حتى 24× درجة. أعلى التصنيفات في BEIR وMTEB للأحجام المدمجة. هذا يتيح لك تشغيل البحث الدلالي، وRAG، والتجميع مع زمن استجابة منخفض، وذاكرة منخفضة، وبدون بطاقة رسومية.