Mám kontinuální dávkování s SSM v mlx-lm. Tady jsou čtyři OpenCode agenti, kteří současně běží na Nvidia Nemotron Nano na 64GB M4 Max. Je to pěkný model pro menší stroje, protože je to MoE + hybridní pozornost (malá cache).