Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Konec roku 2025 znamenal zásadní zlom pro DeepProve, kdy posunul systém dokazování z jedno-node proveru na distribuovaný, GPU-akcelerovaný zkML systém navržený pro reálné inferenční pracovní zatížení.
Přečtěte si kompletní inženýrskou aktualizaci na odkazu níže: 🧵

2/ Přestavěli jsme DeepProve kolem distribuovaného grafu vykonávání.
Místo monolitického dokazu je nyní důkazní logika vyjádřena jako paralelizovatelné podgrafy, které lze rozdělit mezi stroje a provádět současně.
To odemyká horizontální škálování pro generování důkazů.
3/ Lineární algebra je nyní einsum-first.
Všechny lineární vrstvy, včetně hustých a QKV projekcí, byly sjednoceny pod explicitními formulacemi einsum, podporujícími libovolné tenzorové hodnosti.
Výsledek: jednodušší kódová základna, méně na míru šitých vrstev a větší flexibilita pro budoucí architektury modelů.
4/ Opravili jsme hlavní úzké hrdlo, nelineární vrstvy, zavedením jedné generalizované vrstvy Lookup, která zpracovává softmax, ReLU, GELU, layer norm a další, s vestavěnou rekvantizací.
Jinými slovy, méně vrstev, menší režie a lepší výkon.
5/ Přesnost vydržela podle škály výkonu.
Ve srovnání s PyTorch FP32:
• GPT-2 vykazuje <1% perplexity delta
• Gemma-3 vykazuje ~4% perplexitní rozdíl
DeepProve si udržuje vysokou numerickou věrnost i při náročnější optimalizaci.
6/ Inference je nyní přátelská k cachování a nativní pro GPU.
Dodali jsme:
• Poziční cache pro dlouhé sekvence
• Cache pro tenzorové konkatenace pro opětovné použití K/V
Všechny vrstvy nyní běží na GPU, což umožňuje optimistické dokazování: výsledky se vracejí okamžitě, následují asynchronní důkazy.
7/ Průchodnost dosáhla klíčového milníku.
Po analýze a optimalizaci úzkého hrdla od začátku do konce nyní DeepProve udržuje ~1,5 důkazů za sekundu.
To potvrzuje, že zkML dokáže držet krok s praktickou inferencí, nejen offline nebo dávkovými zátěžemi.
8/ Stručně; DR: Čtvrté čtvrtletí roku 2025 posunulo DeepProve na novou úroveň architektury v produkčním měřítku.
Distribuované ověřování, provoz GPU, optimistické důkazy a udržitelná propustnost jsou nyní reálné a škálovatelné, což poskytuje základy potřebné pro ověřitelnou AI.
Brzy přijde více.
426
Top
Hodnocení
Oblíbené
