VALTAVA > Step-3.5-Flash StepFunilta > Agenttinen ja koodaava MONSTER > avoimen lähdekoodin MoE, Apache-2.0 > pyörii täydellisellä kontekstilla > 2x RTX PRO 6000/8x RTX 3090s > 196B MoE, vain 11B aktiivista per token > 256K kontekstia 3:1 liukuvan ikkunan huomion kautta > pitkät koodikannat ja pitkät tehtävät, kustannustehokas pitkä konteksti > vertailuarvot > 74,4 % SWE-bench Vahvistettu > 51,0 % Terminal-Bench 2.0 > vahva päättely, vahva koodaus, vakaat agentit > harva MoE + Top-8 reititys > liukuikkunan huomiolla > MTP-3 ennustaa useita tokeneita samanaikaisesti > tyypillisesti 100–300 tok/s, huiput ~350 tok/s > tarpeeksi nopea rinnakkaisagenteille, ei pelkästään keskustelulle > Apache-2.0 > avosarjat > toimii paikallisesti > Macit, DGX Spark, GPU:t > vLLM, SGLang, Transformers, llama.cpp > juuri tästä "Osta näytönohjain" yritti varoittaa sinua...