Перестаньте витрачати сотні гігабайт на векторний пошук. Нова система пошуку скорочує пам'ять у 32 рази і швидкість на ~25 разів. Це робиться шляхом відокремлення пошуку кандидатів від оцінювання. Пошук розділяється на два дешеві етапи По-перше, він замінює вкладення fp32 на бінарний індекс. Бінарні вектори у 32 рази менші. Лише цей індекс залишається в пам'яті. Це робить початковий пошук швидким і дешевим. Це вигідно лише за точність наприкінці Після отримання було відновлено оцінку невеликої кандидатської множини за допомогою int8-вкладень. Потік: • Бінарний пошук у багатьох документах • Візьміть найкращих кандидатів • Повторення ~40 з них з int8 Це відновлює ~99% якості fp32.