Del I av vår zkVM-trilogi argumenterade för att ersätta HAL med en graf-först-bevisningsarkitektur. Här är datan. Vi jämförde Venus – vår graf-först-backend på ZisK – över GPU och FPGA, och gick igenom vår ursprungliga ZK-hårdvarutes. Här är vad siffrorna visar. 🧵
2/ Graph-first ger mätbara förbättringar på GPU:er. Under HAL startar kärnor sekventiellt. Med cudaGraph fångar och spelar vi upp hela bevisflödet som en schemalagd graf. Det minskar CPU-startöverhead och minskar synkroniseringsjitter för värdenheten↔, särskilt i iterativa faser som sumcheck. Resultaten nedan (jämfört med ZisK 0,15).
3/ Vi testade också FPGA på två enheter: VU47P (AWS F2-klass) och VH1782 (AMD V80-klass). Uppmätt GPU-väggklocka: ~47,8 sekunder FPGA (HLS-uppskattat): ~335–404 sekunder Observera: GPU-tider mäts; FPGA-tider uppskattas utifrån synteslatens ÷ Fmax. Inte äpplen mot äpplen, men riktningsklar. Gap per chip: ~7–8×, främst på grund av FPGA-frekvenstak (74–98 MHz). Varken råprestanda eller prestanda/watt motiverar att byta ut GPU mot FPGA idag.
4/ Men "FPGA är långsammare" är inte slutsatsen. FPGA-arbete tvingade fram precisa definitioner av minneslayouter, gränssnittskontrakt och beroenden mellan bevisstegen. Exakt den grund du behöver innan du designar en ASIC. FPGA är prototypbryggan från graf till hårdvara.
5/ Eftersom provaren är en beräkningsgraf, kompilerar samma logik till vilken backend som helst: GPU → cudaGraph-kärnor FPGA → dataflödesmoduler ASIC → fasta beräkningsblock Endast backend ändras. Grafen förblir densamma.
6/ GPU → FPGA → ASIC är alltså en sammanhängande utveckling. Vi använder GPU med Venus-optimerade konfigurationer för att extrahera stabil, sammansatt prestanda. Även om FPGA inte är prestandakonkurrenskraftigt, bekräftar det den strukturella korrektheten i vår hårdvaruriktning. Graph-first-arkitekturen är bryggan som möjliggör CUDA-grafnivåoptimering idag och ASIC-hårdvarubaserad kompilering imorgon.
161