Fikk kontinuerlig batching til å fungere med SSM-er i mlx-lm. Her er fire OpenCode-agenter som kjører Nvidias Nemotron Nano samtidig på 64GB M4 Max. Dette er en fin modell for mindre maskiner siden det er MoE + hybrid attention (liten cache).