Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Gömüleme yığınınız, sadece modelleri değiştirmek için %100 yeniden indeks zorunlu kalıyor.
Ve çoğu takım bunu kaçınılmaz olarak görüyor.
Yüksek geri alma kalitesi için büyük bir gömme modeliyle bir RAG boru hattı kurduğunuzu ve üretime gönderildiğini düşünün.
Altı ay sonra, uygulama trafiğiniz ve gömüleme modeli maliyetleriniz hızla artıyor, pipeline ise ölçeklenmekte zorlanıyor. Bu yeni talebi karşılamak için maliyet ve gecikmeyi önceliklendiren bir modele geçmek istersiniz.
Ama mevcut gömüleriniz tek bir vektör uzayında kalıyor, yeni model ise başka bir vektörde gömüler üretiyor, bu da onları uyumsuz kılıyor.
Modelleri değiştirmek artık endeksin yeniden oluşturulması anlamına geliyor:
- Her belgenin yeniden gömülmesi gerekir
- Her parça yeniden hesaplanmalıdır
- Sorguların tekrar çalışması için milyonlarca vektörün yeniden oluşturulması gerekiyor
Çoğu takım buna bakar ve geçiş yapmak yerine maliyeti üstlenmeye karar verir.
Zamanla, bu sertleşerek söylenmemiş bir kural haline gelir.
Ya kaliteyi optimize edersiniz ya da maliyeti optimize edersiniz ve erken verdiğiniz kararla yaşıyorsunuz.
Ancak bu, gömmelerin temel bir sınırlaması değildir.
Bu bir tasarım tercihi.
Ya gömülü modeller aynı vektör uzayını paylaşsaydı ne olurdu?
Bu kurulumda, belgeleri büyük bir model kullanarak indeksleyip daha hafif bir modelle sorgulayabilirdiniz, hiçbir şeyi yeniden inşa etmeden.
...

En İyiler
Sıralama
Takip Listesi
