巨大です > ステップ3.5-フラッシュ by StepFun > エージェント&コーディング・モンスター > オープンソースのMoE、Apache-2.0 >完全な文脈をつけて実行します > RTX PRO 6000 2台/RTX 3090 8台 >196億のMoE、1トークンあたり110億しかアクティブではありません > 3:1スライドウィンドウの注意による256Kコンテキスト >長いコードベースと長いタスク、コスト効率の良い長いコンテキスト >ベンチマーク > 74.4%のSWEのbench verified(確認済み) > 51.0% ターミナルベンチ 2.0 >強い推論力、強いコーディング、安定したエージェント > スパースなMoE + Top-8ルーティング スライドウィンドウの注意> >MTP-3は複数のトークンを同時に予測します > 典型的な100〜300 tok/s、ピークは~350 tok/s >並行エージェントが話すだけでなく、十分に速い > apache-2.0 >オープンウェイト >は地元で運行されています > Mac、DGX Spark、GPU > vLLM、SGLang、トランスフォーマー、llama.cpp >これが「Buy a GPU」が警告しようとしたことです...