URIAȘ > Step-3.5-Flash de la StepFun > Agentic & Coding MONSTER > MoE opensource, Apache-2.0 > rulează cu contextul complet activat > 2x RTX PRO 6000/8x RTX 3090s > 196B MoE, doar 11 miliarde activi pe token > 256K context prin fereastră glisantă 3:1 atenție > baze de cod lungi și sarcini lungi, context lung eficient din punct de vedere al costurilor > repere > 74,4% Verificat de banca SWE > 51,0% Terminal-Bench 2.0 > raționament puternic, codare puternică, agenți stabili > MoE rar + rutare Top-8 > cu atenție la fereastra glisantă > MTP-3 prezice mai multe tokenuri simultan > 100–300 tok/s tipic, vârfuri ~350 tok/s > suficient de rapid pentru agenți paraleli, nu doar pentru a discuta > apache-2.0 > la greutăți deschise > circulă local > Mac-uri, DGX Spark, plăci video > vLLM, SGLang, Transformers, llama.cpp > asta a încercat să te avertizeze "Cumpără o placă video"...