DApp Store | Centrum Web3 pro události a hry

Populární témata

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

elie

Tvrdit, že Deepseek postavil MoE na Mixtralu, je nesmysl, článek Deepseek Moe vyšel jen 3 dny poté, co byl Mixtral článek zveřejněn na Arxiv Také článek Mixtral nemá doslova žádné detaily o trénování, takže "vydali jsme skoro všechno, co bylo potřeba k přestavbě tohoto typu architektury" je také nepravda, článek jen říká "používáme Google GSHARD Arch s jednodušším směrováním a MOE každou vrstvu" a žádné detaily o datech, hyperparametrech, trénovacích tokenech, ablacích atd. Architektura, kterou Deepseek Moe používá, je vlastně jiná než GSHARD a je strohější (Deepseek Moe v článku ani necituje Mixtral, ale GSHARD) Neříkám, že Mixtral neměl na MoE vliv, ale to, co je řečeno v tomto rozhovoru, je trochu přepisování příběhu a říká "ale podívejte, Čína/Deepseek také kopíruje Mistral!"

elie19. 1. 23:28

Tým GLM nyní používá MLA!! tohle je docela šílený model s 30B celkovým parametrem a asi 4B aktivní. Velmi pěkné uvolnění Co se týče konstrukce, je to přibližně stejné hloubky jako glm4.5 air a qwen3 30B A3B, celkem 64 expert místo 128, ale aktivují jen 5 místo 9, pokud počítáme sdílený expert

Z.ai19. 1. 22:44

Představujeme GLM-4.7-Flash: Vašeho místního asistenta pro kódování a agenta. GLM-4.7-Flash stanovuje nový standard pro třídu 30B, vyvažuje vysoký výkon s efektivitou, což z něj činí ideální lehkou možnost nasazení. Kromě programování je také doporučován pro tvůrčí psaní, překlady, úkoly s dlouhým kontextem a hraní rolí. Váhy: API: - GLM-4.7-Flash: Zdarma (1 souběžnost) - GLM-4.7-FlashX: Vysokorychlostní a cenově dostupný

53

elie13. 1. 03:14

Ve skutečnosti deepseek používá Muon v ablační sestavě svého nejnovějšího článku

115

Top

Hodnocení

Oblíbené

Čeština 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

Více o OKX Peněžence

Stáhnout Akademie Informace o nás Kariéra Kontaktujte nás Podmínky poskytování služeb Zásady ochrany osobních údajů X (dříve Twitter)

Produkt

Tokeny Swap Tržiště Vydělávejte Objevujte Budujte Průzkumník Zabezpečení

Podpora

Centrum podpory Ověření oficiálního obsahu Oznámení Rozpis poplatků na DEX Propojit s OKX Peněženka sítě Bitcoin Peněženka sítě Ethereum Peněženka sítě Solana