توقف عن إهدار مئات الجيجابايت على البحث المتجه. إعداد الاسترجاع الجديد يقلل الذاكرة بمقدار 32x والسرعة ~25x. يقوم بذلك عن طريق فصل البحث عن المرشح عن التقييم. يقسم البحث إلى خطوتين رخيصتين أولا، يستبدل تضمين fp32 بمؤشر ثنائي. المتجهات الثنائية أصغر ب 32 مرة. فقط هذا الفهرس يبقى في الذاكرة. هذا يجعل البحث الأولي سريعا ورخيصا. لا يدفع إلا مقابل الدقة في النهاية بعد الاسترجاع، أعاد تسجيل مجموعة مرشحين صغيرة باستخدام تضمينات int8. التدفق: • البحث الثنائي عبر العديد من الوثائق • اختيار أفضل المرشحين • أعد تسجيل ~40 منهم باستخدام int8 هذا يعيد ~99٪ من جودة fp32.