Konec roku 2025 znamenal zásadní zlom pro DeepProve, kdy posunul systém dokazování z jedno-node proveru na distribuovaný, GPU-akcelerovaný zkML systém navržený pro reálné inferenční pracovní zatížení. Přečtěte si kompletní inženýrskou aktualizaci na odkazu níže: 🧵
2/ Přestavěli jsme DeepProve kolem distribuovaného grafu vykonávání. Místo monolitického dokazu je nyní důkazní logika vyjádřena jako paralelizovatelné podgrafy, které lze rozdělit mezi stroje a provádět současně. To odemyká horizontální škálování pro generování důkazů.
3/ Lineární algebra je nyní einsum-first. Všechny lineární vrstvy, včetně hustých a QKV projekcí, byly sjednoceny pod explicitními formulacemi einsum, podporujícími libovolné tenzorové hodnosti. Výsledek: jednodušší kódová základna, méně na míru šitých vrstev a větší flexibilita pro budoucí architektury modelů.
4/ Opravili jsme hlavní úzké hrdlo, nelineární vrstvy, zavedením jedné generalizované vrstvy Lookup, která zpracovává softmax, ReLU, GELU, layer norm a další, s vestavěnou rekvantizací. Jinými slovy, méně vrstev, menší režie a lepší výkon.
5/ Přesnost vydržela podle škály výkonu. Ve srovnání s PyTorch FP32: • GPT-2 vykazuje <1% perplexity delta • Gemma-3 vykazuje ~4% perplexitní rozdíl DeepProve si udržuje vysokou numerickou věrnost i při náročnější optimalizaci.
6/ Inference je nyní přátelská k cachování a nativní pro GPU. Dodali jsme: • Poziční cache pro dlouhé sekvence • Cache pro tenzorové konkatenace pro opětovné použití K/V Všechny vrstvy nyní běží na GPU, což umožňuje optimistické dokazování: výsledky se vracejí okamžitě, následují asynchronní důkazy.
7/ Průchodnost dosáhla klíčového milníku. Po analýze a optimalizaci úzkého hrdla od začátku do konce nyní DeepProve udržuje ~1,5 důkazů za sekundu. To potvrzuje, že zkML dokáže držet krok s praktickou inferencí, nejen offline nebo dávkovými zátěžemi.
8/ Stručně; DR: Čtvrté čtvrtletí roku 2025 posunulo DeepProve na novou úroveň architektury v produkčním měřítku. Distribuované ověřování, provoz GPU, optimistické důkazy a udržitelná propustnost jsou nyní reálné a škálovatelné, což poskytuje základy potřebné pro ověřitelnou AI. Brzy přijde více.
426