ВЕЛИЧЕЗНИЙ > Step-3.5-Flash від StepFun > Агентний і кодовий МОНСТР > opensource MoE, Apache-2.0 > працює з повним контекстом > 2x RTX PRO 6000/8x RTX 3090 > 196B MoE, активне лише 11B на токен > контекст 256K за допомогою уваги 3:1 для рухомого вікна > довгі кодові бази та довгі завдання, економічно вигідні в довгому контексті > бенчмарки > 74,4% SWE-лавка Підтверджено > 51,0% Terminal-Bench 2,0 > сильне мислення, сильне кодування, стабільні агенти > розріджене маршрутизування MoE + Top-8 > з увагою ковзного вікна > MTP-3 прогнозує кілька токенів одночасно > 100–300 ток/с типово, піки ~350 ток/с > достатньо швидко для паралельних агентів, а не просто для чату > Apache-2.0 > відкриті ваги > працює локально > Mac, DGX Spark, GPU > vLLM, SGLang, Трансформери, llama.cpp > саме про це «Купіть відеокарту» намагалися вас попередити...