deepseek v3 (MLA och DSA) inferensen (optimerad för numerisk stabilitet vid RL-utrullningar) kommer till NMOE (PEF vs Cerebras som referens)