Ich betreibe Qwen3.5-122B-A10B-Q4_K_L (Bartowski) auf Strix Halo, 220k Kontext schlägt ein. Die Geschwindigkeit nimmt mit dem Kontext auf jeden Fall etwas ab, aber das ist mir egal, die Qualität des Denkens steht über allem. 8-20 Tok/Sekunde, je nach Kontextschwere.