Heb continue batching werkend gekregen met SSM's in mlx-lm. Hier zijn vier OpenCode-agenten die tegelijkertijd Nvidia's Nemotron Nano draaien op 64GB M4 Max. Dit is een mooi model voor kleinere machines, aangezien het MoE + hybride aandacht (kleine cache) is.