deepseek v3 (MLA и DSA) вывод (оптимизированный для числовой стабильности для RL развертываний) приходит в nmoe (производительность по сравнению с cerebras для справки)