DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Upotuspinosi pakottaa 100 % uudelleenindeksoinnin pelkästään mallien vaihtamiseksi. Ja useimmat tiimit pitävät sitä väistämättömänä. Kuvittele, että rakennat RAG-putken, jossa on suuri upotusmalli korkean hakulaadun saavuttamiseksi, ja se toimitetaan tuotantoon. Puoli vuotta myöhemmin sovellusliikenteesi ja upotusmallin kustannukset nousevat räjähdysmäisesti, samalla kun putkistosi kamppailee skaalautumisen kanssa. Haluat vaihtaa malliin, joka priorisoi kustannukset ja viiveen vastataksesi tähän uuteen kysyntään. Mutta olemassa olevat upotuksesi sijaitsevat yhdessä vektoritilassa, kun taas uusi malli tuottaa upotuksia toiseen, mikä tekee niistä yhteensopimattomia. Mallin vaihtaminen tarkoittaa nyt indeksin uudelleenrakentamista: - Jokainen asiakirja täytyy upottaa uudelleen - Jokainen lohko on laskettava uudelleen - Miljoonia vektoreita täytyy generoida uudelleen ennen kuin kyselyt toimivat uudelleen Useimmat joukkueet katsovat tätä ja päättävät kantaa kustannukset sen sijaan, että vaihtaisivat. Ajan myötä tämä kovettuu sanattomaksi säännöksi. Optimoit joko laadun tai kustannusten perusteella, ja elät aikaisin tekemäsi päätöksen kanssa. Mutta tämä ei ole upotusten perustavanlaatuinen rajoitus. Se on suunnitteluvalinta. Entä jos upotusmallit jakaisivat saman vektoritilan? Tässä kokoonpanossa voisit indeksoida dokumentteja isolla mallilla ja kysyä niitä kevyemmällä mallilla ilman, että mitään rakennettiin uudelleen. ...

Johtavat

Rankkaus

Suosikit