Slutten av 2025 markerte et viktig vendepunkt for DeepProve, som utviklet testsystemet fra en enkeltnode prover til et distribuert, GPU-akselerert zkML-system designet for virkelige inferensarbeidsbelastninger. Les hele ingeniøroppdateringen på lenken nedenfor: 🧵
2/ Vi omstrukturerte DeepProve rundt en distribuert utførelsesgraf. I stedet for en monolittisk beviser, uttrykkes bevislogikk nå som parallelliserbare delgrafer som kan deles opp på tvers av maskiner og utføres samtidig. Dette låser opp horisontal skalering for bevisgenerering.
3/ Lineær algebra er nå einsum-først. Alle lineære lag, inkludert tette og QKV-projeksjoner, ble forent under eksplisitte einsumformuleringer, som støttet vilkårlige tensorranger. Resultatet: en enklere kodebase, færre skreddersydde lag og mer fleksibilitet for fremtidige modellarkitekturer.
4/ Vi løste en stor flaskehals, ikke-lineære lag, ved å introdusere et enkelt generalisert Lookup-lag som håndterer softmax, ReLU, GELU, lagnorm og mer, med innebygd rekvantisering. Altså færre lag, mindre overhead og bedre ytelse.
5/ Nøyaktigheten holdt seg oppe etter hvert som ytelsen skalerte. Sammenlignet med PyTorch FP32: • GPT-2 viser <1 % perplexitetsdelta • Gemma-3 viser ~4 % perplexitetsdelta DeepProve opprettholder høy numerisk nøyaktighet selv under tyngre optimalisering.
6/ Inference er nå caching-vennlig og GPU-native. Vi la til: • Posisjonelle cacher for lange sekvenser • Tensor-konkatenasjonscacher for K/V-gjenbruk Alle lag kjører nå på GPU, noe som muliggjør optimistisk bevising: resultatene returnerer umiddelbart, bevisene følger asynkront.
7/ Gjennomstrømningen nådde en viktig milepæl. Etter ende-til-ende-flaskehalsanalyse og optimalisering, opprettholder DeepProve nå ~1,5 bevis per sekund. Dette bekrefter at zkML kan holde tritt med praktisk inferens, ikke bare offline eller batch-arbeidsbelastninger.
8/ TL; DR: Q4 i 2025 flyttet DeepProve til et nytt nivå av produksjonsarkitektur. Distribuert bevising, GPU-utførelse, optimistiske bevis og vedvarende gjennomstrømning er nå reelle og skalerbare, og gir grunnlaget for verifiserbar AI. Mer kommer snart.
429