je fais fonctionner Qwen3.5-122B-A10B-Q4_K_L (Bartowski) sur strix halo, 220k de contexte c'est génial. la vitesse diminue un peu avec le contexte, c'est sûr, mais je m'en fiche, la qualité du raisonnement avant tout. 8-20 tok/sec selon la lourdeur du contexte