Конец 2025 года стал важной точкой поворота для DeepProve, продвигая систему доказательства от одноузлового провайдера к распределенной системе zkML с ускорением на GPU, предназначенной для реальных рабочих нагрузок вывода. Читать полное обновление по инженерным вопросам по ссылке ниже: 🧵
2/ Мы переработали DeepProve вокруг распределенного графа выполнения. Вместо монолитного доказателя логика доказательства теперь выражается в виде параллелизуемых подграфов, которые могут быть разделены между машинами и выполняться одновременно. Это открывает горизонтальное масштабирование для генерации доказательств.
3/ Линейная алгебра теперь основана на einsum. Все линейные слои, включая плотные и проекции QKV, были объединены под явными формулировками einsum, поддерживающими произвольные ранги тензоров. Результат: более простой код, меньше специализированных слоев и больше гибкости для будущих архитектур моделей.
4/ Мы устранили основное узкое место, нелинейные слои, введя один обобщенный слой Lookup, который обрабатывает softmax, ReLU, GELU, нормализацию слоя и многое другое, с встроенной реквантизацией. Иными словами, меньше слоев, меньше накладных расходов и лучшая производительность.
5/ Точность сохранялась по мере увеличения производительности. По сравнению с PyTorch FP32: • GPT-2 показывает <1% дельту перплексии • Gemma-3 показывает ~4% дельту перплексии DeepProve поддерживает высокую числовую точность даже при более тяжелой оптимизации.
6/ Вывод теперь дружелюбен к кэшированию и работает на GPU. Мы добавили: • Позиционные кэши для длинных последовательностей • Кэши конкатенации тензоров для повторного использования K/V Все слои теперь работают на GPU, что позволяет оптимистичному доказательству: результаты возвращаются немедленно, доказательства следуют асинхронно.
7/ Пропускная способность достигла ключевого этапа. После анализа и оптимизации узких мест от начала до конца, DeepProve теперь поддерживает ~1.5 доказательств в секунду. Это подтверждает, что zkML может соответствовать практическому выводу, а не только оффлайн или пакетным рабочим нагрузкам.
8/ Кратко: Четвертый квартал 2025 года перевел DeepProve на новый уровень архитектуры производственного масштаба. Распределенное доказательство, выполнение на GPU, оптимистичные доказательства и устойчивый пропускной способностью теперь реальны и масштабируемы, обеспечивая основы, необходимые для верифицируемого ИИ. Скоро будет больше.
409