Slutet av 2025 markerade en viktig vändpunkt för DeepProve, där provsystemet utvecklades från en en-nod-prover till ett distribuerat, GPU-accelererat zkML-system utformat för verkliga inferensarbetsbelastningar. Läs hela ingenjörsuppdateringen på länken nedan: 🧵
2/ Vi omstrukturerade DeepProve kring en distribuerad exekveringsgraf. Istället för en monolitisk bevisare uttrycks bevislogik nu som parallelliserbara delgrafer som kan delas upp mellan maskiner och köras samtidigt. Detta låser upp horisontell skalning för bevisgenerering.
3/ Linjär algebra är nu einsum-först. Alla linjära lager, inklusive täta och QKV-projektioner, var förenade under explicita einsumformuleringar, som stödde godtyckliga tensorrankningar. Resultatet: en enklare kodbas, färre skräddarsydda lager och mer flexibilitet för framtida modellarkitekturer.
4/ Vi löste en stor flaskhals, icke-linjära lager, genom att införa ett enda generaliserat Lookup-lager som hanterar softmax, ReLU, GELU, lagernorm och mer, med rekvantisering inbyggd. Alltså färre lager, mindre overhead och bättre prestanda.
5/ Noggrannheten höll sig när prestandan skalade. Jämfört med PyTorch FP32: • GPT-2 visar <1 % perplexitetsdelta • Gemma-3 visar ~4 % perplexitetsdelta DeepProve bibehåller hög numerisk trohet även under tyngre optimering.
6/ Inference är nu cachevänligt och GPU-native. Vi lade till: • Positionscacher för långa sekvenser • Tensor-sammanfogningscacher för K/V-återanvändning Alla lager körs nu på GPU:n, vilket möjliggör optimistisk bevisning: resultaten återvänder omedelbart, bevisen följer asynkront.
7/ Genomströmningen nådde en viktig milstolpe. Efter en enda-till-änd-flaskhalsanalys och optimering upprätthåller DeepProve nu ~1,5 bevis per sekund. Detta bekräftar att zkML kan hålla jämna steg med praktisk inferens, inte bara offline- eller batcharbetsbelastningar.
8/ TL; DR: Q4 2025 tog DeepProve till en ny nivå av produktionsarkitektur. Distribuerad bevisning, GPU-exekvering, optimistiska bevis och uthållig genomströmning är nu verkliga och skalbara, vilket ger grunderna för verifierbar AI. Mer kommer snart.
417