Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La Parte I della nostra trilogia zkVM ha sostenuto la necessità di sostituire HAL con un'architettura di prova basata su grafi.
Ora ecco i dati. Abbiamo effettuato un benchmark di Venus – il nostro backend basato su grafi su ZisK – su GPU e FPGA, e abbiamo rivisitato la nostra tesi originale sull'hardware ZK.
Ecco cosa mostrano i numeri. 🧵

2/ Graph-first offre guadagni misurabili sulle GPU.
Sotto HAL, i kernel vengono lanciati in sequenza.
Con cudaGraph, catturiamo e riproduciamo l'intero flusso di prova come un grafo programmato. Questo riduce l'overhead di lancio della CPU e diminuisce il jitter di sincronizzazione host↔device, specialmente nelle fasi iterative come il sumcheck.
Risultati sotto (in confronto a ZisK 0.15).

3/ Abbiamo anche testato FPGA su due dispositivi: VU47P (classe F2 di AWS) e VH1782 (classe V80 di AMD).
Tempo di wall-clock GPU misurato: ~47.8s
FPGA (stimato da HLS): ~335–404s
Nota: i tempi GPU sono misurati; i tempi FPGA sono stimati dalla latenza di sintesi ÷ Fmax. Non è un confronto diretto, ma è chiaro nella direzione.
Differenza per chip: ~7–8×, principalmente a causa dei limiti di frequenza FPGA (74–98 MHz).
Né le prestazioni grezze né le prestazioni/watt giustificano la sostituzione della GPU con FPGA oggi.
4/ Ma "FPGA è più lento" non è la conclusione.
Il lavoro con FPGA ha costretto a definizioni precise dei layout di memoria, contratti di interfaccia e dipendenze tra le fasi di dimostrazione. Esattamente le basi necessarie prima di progettare un ASIC.
FPGA è il ponte di prototipazione da grafo a hardware.
5/ Poiché il prover è un grafo di calcolo, la stessa logica si compila su qualsiasi backend:
GPU → kernel cudaGraph
FPGA → moduli di flusso dati
ASIC → blocchi di calcolo fissi
Solo il backend cambia. Il grafo rimane lo stesso.
6/ GPU → FPGA → ASIC è quindi un'evoluzione coerente.
Utilizziamo GPU con configurazioni ottimizzate per Venus per estrarre prestazioni stabili e composte.
Sebbene l'FPGA non sia competitivo in termini di prestazioni, conferma la correttezza strutturale della nostra direzione hardware.
L'architettura orientata ai grafi è il ponte che consente l'ottimizzazione a livello di grafi cuda oggi e la compilazione nativa hardware ASIC domani.

156
Principali
Ranking
Preferiti
