Mendapat batching berkelanjutan yang bekerja dengan SSM di mlx-lm. Berikut adalah empat agen OpenCode yang secara bersamaan menjalankan Nemotron Nano Nvidia pada 64GB M4 Max. Ini adalah model yang bagus untuk mesin yang lebih kecil karena ini adalah perhatian MoE + hibrida (cache kecil).