Я запускаю Qwen3.5-122B-A10B-Q4_K_L (Bartowski) на Strix Halo, 220k контекста классно. Скорость немного падает с увеличением контекста, но мне все равно, качество рассуждений важнее всего. 8-20 токов/сек в зависимости от нагрузки контекста