Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Automatizace ověřování inference strojového učení s nulovými znalostmi v decentralizovaných výpočetních sítích
@inference_labs, @OpenGradient, @nesaorg
Problém ověření, zda jsou výsledky inference umělé inteligence správně vypočítány v distribuované výpočetní síti, má složitá omezení, která se liší od těch v centrálním serverovém prostředí. Je to proto, že ve struktuře, kde více účastníků spouští stejný model v různých hardwarových a softwarových prostředích, je obtížné předem předpokládat spolehlivost výsledků výpočtu. V tomto kontextu se nulové znalosti strojového učení objevily jako technologie, která kryptograficky dokazuje, že konkrétní výstup byl generován zpracováním konkrétního vstupu pevným způsobem prostřednictvím pevného modelu. Tato metoda je hodnocena jako vhodný prostředek pro distribuované prostředí, protože může ověřit legitimitu provedení, aniž by se proces výpočtu zveřejnil vnějšímu světu.
Umělá inteligence však usuzuje inherentně neurčito. Díky nepropojené povaze operací s plovoucí desetinnou čárkou má i stejná operace jemné rozdíly ve výsledcích v závislosti na pořadí výpočtu nebo hardwarové implementaci, a tento rozdíl je ještě výraznější v prostředí GPU používajících paralelní operace. Distribuované sítě zahrnují širokou škálu zařízení, od spotřebitelských GPU až po specializované akcelerátory, což vede k výpočetním odchylkám v důsledku rozdílů v operačních systémech, ovladačích, paměťových strukturách a instrukčních sadách. Protože kryptografické ověřování vyžaduje bitové dohody, tyto environmentální rozdíly mohou vést k neúspěchům ověření.
K vyřešení tohoto problému kvantizuje systém zkML operace s plovoucí desetinnou čárkou na pevnou desetinnou čárku a převádí operace neuronových sítí na aritmetické obvody. Rámce jako JSTprove, EZKL a RISC Zero reprezentují konvoluce, násobení matic a aktivační funkce jako množiny omezení, což umožňuje prokázat proces inference. Tento proces se rychle zvyšuje s hloubkou a velikostí modelu a čas a využití paměti potřebné k generování důkazů také roste nelineárně. Skutečná měření ukazují, že důkazy zkML pro celý model vyžadují tisíce až desetitisíckrát vyšší náklady než přepočítání stejného odvozování.
Tato nákladová struktura je klíčovým omezením při navrhování automatizovaného ověřování inference v distribuované síti. Pokud jsou náklady na vytvoření důkazu větší než pochybnosti o výsledku inference, ověřování ztrácí svůj ekonomický význam. V důsledku toho reálné systémy přijímají strategii selektivního ověřování pouze klíčových operací nebo citlivých částí místo dokazování celého modelu. DSperse od Inference Labs výrazně snižuje spotřebu paměti a náklady na důkazy tím, že model rozděluje na více částí a obvodů a dokazuje pouze ty části, kde je spolehlivost obzvlášť důležitá. Tato metoda neposkytuje úplný důkaz celého výpočtu, ale přispívá k zajištění efektivity ověřování ve srovnání s náklady.
Automatizovaný ověřovací proces je založen na této volitelné ověřovací strategii. JSTprove pipeline Inference Labs převádí model na pevný bod, kompiluje graf ve formátu ONNX do aritmetického obvodu a generuje důkazy pomocí důkazového systému založeného na GKR. Generované důkazy jsou ověřovány on-chain i off-chain, a ve skutečnosti je velké množství důkazů zpracováváno periodicky na konkrétní decentralizované síti. OpenGradient je navržen tak, aby zpracovával více inferenčních požadavků současně prostřednictvím paralelní struktury vykonávaní nazvané PIPE a každý požadavek si může vybrat mezi zkML, důvěryhodným prostředím pro provádění nebo neověřovaným vykonáním. To upravuje náklady na validaci tak, aby se nestaly přímou překážkou pro blokování generování nebo celkové propustnosti.
NESA přistupuje k tomu, který kombinuje automatizaci validace s výpočetní ochranou. Používá strukturu, která rozděluje vstupní data mezi více uzlů při šifrování, provádí inferenci v zašifrovaných fragmentech a poté agreguje výsledky. V tomto procesu je výběr uzlů a přidělování rolí koordinováno pomocí ověřitelných náhodných čísel a kritické kryptografie, přičemž podvádění je odrazováno procesem potvrzování a zveřejnění. Tento přístup zajišťuje nejen integritu výsledků inferencí, ale také důvěrnost vstupů a parametrů modelu.
Integrace ověřování založeného na zkML do decentralizovaných výpočetních sítí objasňuje oddělení rolí mezi vykonáním a ověřováním. Strategie paralelizace OpenGradient umožňuje zpracovávat více inferencí současně při samostatném řízení validačního procesu, zatímco koordinační vrstva NESA je zodpovědná za rozdělení rolí a motivaci mezi uzly. Důkazní vrstva Inference Labs je zodpovědná za kryptografické ověření, že skutečné výpočty byly provedeny správně. Jakmile jsou jednotlivé vrstvy odděleny, automatizovaná verifikace je realizována kombinací více komponent místo jedné technologie.
Motivační struktura je také klíčovým prvkem automatizace. Nesa povzbuzuje zúčastněné uzly, aby jednaly poctivě prostřednictvím struktury staking a commit, zatímco Inference Labs rozděluje odměny na základě schopnosti a přesnosti generování důkazů. Služby založené na digitálních dvojčácích od OpenGradient převádějí právo na přístup k ověřeným výsledkům inference do ekonomické hodnoty. Tyto struktury jsou navrženy tak, aby udržely určitou úroveň důvěry i bez centrálního správce.
Automatizované ověřování inference zkML má však jasná omezení. Asymetrie mezi náklady na generování nesprávného výsledku a náklady na prokázání správného výsledku ponechává možnost útoku. Chyby v procesu převodu obvodů, zpoždění při generování důkazů, koluze mezi uzly a výpočetní odchylky způsobené hardwarovými chybami nelze současnou technologií zcela odstranit. Systémy tato rizika zmírňují prostřednictvím replikačních praktik, reputace a ekonomických sankcí, ale zásadně je neeliminují.
Společně vykazují automatizace strojového učení s nulovými znalostmi, inference a ověřování v decentralizovaných výpočetních sítích jasné technické úspěchy jako pokus o kryptografické zabezpečení spolehlivosti výpočtů. Zároveň odhaluje strukturální omezení vysokých nákladů na důkazy, environmentálních omezení a ekonomické asymetrie. Současný přístup implementuje praktickou automatizaci kombinací selektivních důkazů, paralelního provádění, šifrovaného výpočtu a motivačního návrhu, což je považováno za příklad přiblížení ověřitelnosti umělé inteligence do realistického rozsahu v distribuovaném prostředí.
$NESA



Top
Hodnocení
Oblíbené
