používám Qwen3.5-122B-A10B-Q4_K_L (Bartowski) na Strix Halo, 220k kontext Plácnutí. Rychlost s kontextem určitě trochu klesá, ale je mi to jedno, kvalita rozumu je důležitější než všechno. 8-20 tok/s v závislosti na náročnosti kontextu