Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Avi Chawla
Denní návody a postřehy o DS, ML, LLM a RAG • Spoluzakladatel @dailydoseofds_ • IIT Varanasi • bývalý inženýr AI @ MastercardAI
Dokonalý kompletní plán AI Engineering pro přechod z 0 na 100.
Toto je přesně zmapovaná cesta toho, co je vlastně potřeba k přechodu od začátečníka → plnohodnotného inženýra umělé inteligence.
> Začněte se základy kódování.
> Naučte se Python, Bash, Git a testování.
> Každý silný inženýr umělé inteligence začíná základy.
> Naučte se pracovat s modely pomocí LLM API.
> To vás naučí strukturované výstupy, cachování, systémové prompty, atd.
> API jsou skvělá, ale surové LLM stále potřebují nejnovější informace, aby byly efektivní.
> Zjistěte, jak jsou LLM obvykle rozšířeny o více informací/vzorů.
> To vás naučí základy jemného ladění, RAG, prompt/context engineeringu atd.
> Silné LLM jsou bez kontextu k ničemu. A právě zde pomáhají techniky vyhledávání.
> Zjistěte více o vektorových databázích, hybridním načítání, strategiích indexování atd.
> Jakmile je načítání pevné, přejděte do RAG.
> Naučte se vytvářet kanály načítání + generování, přeřazování a vícestupňové načítání pomocí oblíbených orchestračních architektur.
> Nyní vstupte do AI Agents, kde se AI posouvá od odpovídání k jednání.
> Naučte se paměť, multiagentní systémy, návrh člověka ve smyčce, agentní vzory atd.
> Naučte se dodávat v produkčním prostředí s infrastrukturou.
> To vás naučí CI/CD, kontejnery, směrování modelů, Kubernetes a nasazení ve velkém měřítku.
> se zaměřit na pozorovatelnost a hodnocení.
> Naučte se vytvářet zkušební datové sady, LLM-as-a-judge, trasování, instrumentaci a průběžné vyhodnocovací kanály.
> Bezpečnost je klíčová.
> Naučte se implementovat mantinely, sandboxing, obranu proti rychlému injektáži a etické pokyny.
> Nakonec prozkoumejte pokročilé pracovní postupy.
> To zahrnuje hlasové a obrazové agenty, agenty CLI, robotiku, roje agentů a samozdokonalující se systémy umělé inteligence.
Toto je skutečná cesta k tomu, jak se stát Full-Stack AI Engineerem a nejen "používat" AI, ale navrhovat full-stack systémy AI, které mohou přežít ve výrobě.
O co jsem přišel? Příspěvek v odpovědích!

405
Váš embedding stack nutí 100% reindex jen kvůli změně modelu.
A většina týmů to považuje za nevyhnutelné.
Představte si, že jste vytvořili RAG pipeline s velkým modelem embeddingu pro vysokou kvalitu získávání a ten se odesílá do výroby.
O šest měsíců později vaše aplikační provoz a náklady na model vkládání vystřelují, zatímco váš pipeline se snaží škálovat. Chcete přejít na model, který upřednostňuje náklady a latenci, abyste vyhověli této nové poptávce.
Ale vaše stávající embeddingy jsou v jednom vektorovém prostoru, zatímco nový model vytváří embeddingy v jiném, což je činí neslučitelnými.
Přechod na model nyní znamená přestavbu indexu:
- Každý dokument je třeba znovu vložit
- Každý blok musí být znovu spočítán
- Je třeba znovu generovat miliony vektorů, než dotazy opět fungují
Většina týmů se na to podívá a rozhodne se náklady pokrýt místo přechodu.
Postupem času se to ztvrdne v nevyřčené pravidlo.
Buď optimalizujete kvalitu, nebo náklady a žijete s rozhodnutím, které jste učinili brzy.
Ale to není zásadní omezení embeddingů.
Je to designová volba.
Co kdyby embedding modely sdílely stejný vektorový prostor?
V tomto nastavení jste mohli indexovat dokumenty pomocí velkého modelu a dotazovat je pomocí lehčího, aniž byste museli cokoli znovu budovat.
- Vektory zůstávají stejné.
- Databáze zůstává stejná.
- Reindexace již není nutná.
Jakmile problém vidíte tímto způsobem, architektura je zřejmá.
A nejnovější série Voyage 4 od Voyage AI tuto schopnost přesně umožňuje.
Takto to vypadá v praxi:
voyage-4-large je první produkční model embeddingu postavený na architektuře Mix of Experts a spolupracoval jsem s týmem MongoDB na tom, jak funguje.
O MoE jsem už dříve psal, ale dovolte mi to rychle rozebrat:
Většina modelů vkládání používá každý parametr pro každý dotaz.
voyage-4-large aktivuje pouze experty relevantní pro každý vstup, což zachovává kvalitu vyhledávání a zároveň snižuje množství výpočetní náročnosti na dotaz.
Výsledkem je špičková přesnost s o 40 % nižšími náklady na obsluhu.
A tady to pro vývojáře začíná být ještě lepší: voyage-4-nano je otevřená verze na Hugging Face, což usnadňuje místní vývoj a experimentování.
A protože všechny modely v rodině sdílejí stejný prostor pro vložení, máte jasnou cestu od vývoje k výrobě:
→ Prototyp lokálně s voyage-4-nano
→ Testování s voyage-4-lite pro dotazy citlivé na náklady
→ Index s voyage-4-large pro maximální kvalitu
→ Míchejte modely ve stejném pipeline bez nutnosti přestavovat index
Hlavní pointa je tato:
Model, se kterým začnete, by neměl určovat, jak se váš systém vyvíjí.
- Izolované vektorové prostory vedou k uzamčeným rozhodnutím
- Sdílené vektorové prostory zachovávají schopnost přizpůsobovat se v čase
Odkaz na stažení modelu Voyage-4-Nano od HF jsem sdílel v odpovědích @VoyageAIs sdílel s odkazy.

321
Top
Hodnocení
Oblíbené
