Часть I нашей трилогии zkVM обосновала замену HAL на архитектуру доказательства с приоритетом графов. Теперь вот данные. Мы провели бенчмаркинг Venus – нашего бэкенда с приоритетом графов на ZisK – на GPU и FPGA и пересмотрели нашу оригинальную тезу о ZK-аппаратном обеспечении. Вот что показывают цифры. 🧵
2/ Graph-first обеспечивает измеримые преимущества на GPU. В рамках HAL ядра запускаются последовательно. С помощью cudaGraph мы захватываем и воспроизводим весь процесс доказательства в виде запланированного графа. Это сокращает накладные расходы на запуск CPU и уменьшает дрожание синхронизации хоста и устройства, особенно на итеративных этапах, таких как sumcheck. Результаты ниже (по сравнению с ZisK 0.15).
3/ Мы также протестировали FPGA на двух устройствах: VU47P (класс F2 от AWS) и VH1782 (класс V80 от AMD). Измеренное время работы GPU: ~47.8с FPGA (оценка HLS): ~335–404с Примечание: времена GPU измерены; времена FPGA оценены на основе задержки синтеза ÷ Fmax. Это не совсем сопоставимо, но направление ясно. Разница на чип: ~7–8×, в основном из-за пределов частоты FPGA (74–98 МГц). Ни сырая производительность, ни производительность на ватт не оправдывают замену GPU на FPGA сегодня.
4/ Но "FPGA медленнее" не является выводом. Работа с FPGA заставила точно определить макеты памяти, контракты интерфейсов и зависимости между этапами доказательства. Именно тот фундамент, который вам нужен перед проектированием ASIC. FPGA — это мост между графами и аппаратным прототипированием.
5/ Поскольку доказательство является графом вычислений, та же логика компилируется для любого бэкенда: GPU → ядра cudaGraph FPGA → модули потоковой передачи данных ASIC → фиксированные вычислительные блоки Меняется только бэкенд. Граф остается тем же.
6/ GPU → FPGA → ASIC является последовательной эволюцией. Мы используем GPU с оптимизированными для Venus конфигурациями для достижения стабильной, нарастающей производительности. Хотя FPGA не конкурентоспособен по производительности, он подтверждает структурную правильность нашего направления в аппаратном обеспечении. Архитектура с приоритетом графа является мостом, который позволяет сегодня оптимизировать на уровне графа cuda и компилировать аппаратное обеспечение ASIC завтра.
183