Vektör aramasına yüzlerce gigabayt harcamayı bırakın. Yeni bir geri alma sistemi belleği 32 kat, hızı ~25 kat azaltıyor. Bunu, aday aramasını puanlamadan ayırarak yapar. Aramayı iki ucuz adıma ayırıyor İlk olarak, fp32 gömülmelerini ikili bir indeksle değiştirir. İkili vektörler 32 kat daha küçüktür. Sadece bu indeks hafızada kalır. Bu da ilk aramayı hızlı ve ucuz hale getiriyor. Sadece sonunda doğruluk için ödeme yapar Geri alındıktan sonra, int8 gömmeleri kullanılarak küçük bir aday seti yeniden puanladı. Akış: • Birçok belge üzerinde ikili arama • En iyi adayları seçin • ~40'ını int8 ile yeniden puanladı Bu, fp32 kalitesinin ~%99'unu geri kazanıyor.