BÜYÜK > StepFun tarafından Step-3.5-Flash > Ajanik ve Kodlama MONSTER > açık kaynak MoE, Apache-2.0 > tam bağlamla çalışıyor > 2x RTX PRO 6000/8x RTX 3090 > 196B MoE, her jeton başına sadece 11B aktif > 3:1 kaydırmalı pencere dikkatiyle 256K bağlam > uzun kod tabanları ve uzun görevler, maliyet etkin uzun bağlam > kıyaslamaları > %74,4 SWE-bench Doğrulandı > %51,0 Terminal-Bench 2.0 > güçlü akıl yürütme, güçlü kodlama, kararlı ajanlar > seyrek MoE + Top-8 yönlendirme > kaydırma pencere dikkatiyle > MTP-3, aynı anda birden fazla token öngörür > 100–300 tok/s tipik, zirveler ~350 tok/s > paralel ajanlar için yeterince hızlı, sadece sohbet etmek değil > apache-2.0 > açık siklet > yerel olarak faaliyet gösterir > Mac, DGX Spark, GPU'lar > vLLM, SGLang, Transformers, llama.cpp > "GPU Satın Alın" sizi uyarmaya çalıştığı şey bu...