私はStrix HaloでQwen3.5-122B-A10B-Q4_K_L(Bartowski)を使っています。コンテキストは220kです 平手拍手。確かに文脈によって速度は少し落ちますが、私は気にしません。品質を何よりも重視しています。状況の重さによりますが、8〜20 tok/secです