巨大的 > 第3.5步-逐步閃光由StepFun提供 > 代理與編碼怪物 > 開源MoE,Apache-2.0 > 在 > 2x RTX PRO 6000/8x RTX 3090s上運行全上下文 > 196B MoE,每個標記僅11B活躍 > 通過3:1滑動窗口注意力256K上下文 > 長代碼庫和長任務,成本效益高的長上下文 > 基準 > 74.4% SWE-bench 驗證 > 51.0% Terminal-Bench 2.0 > 強大的推理,強大的編碼,穩定的代理 > 稀疏MoE + 前8路由 > 具有滑動窗口注意力 > MTP-3同時預測多個標記 > 典型速度100–300 tok/s,峰值約350 tok/s > 足夠快以支持並行代理,而不僅僅是聊天 > apache-2.0 > 開放權重 > 本地運行 > Macs,DGX Spark,GPU > vLLM,SGLang,Transformers,llama.cpp > 這就是“購買GPU”試圖警告你的事情...