MLX-lm'de SSM'lerle sürekli toplu çalışmaya başladım. İşte 64GB M4 Max'te Nvidia'nın Nemotron Nano'sunu aynı anda çalıştıran dört OpenCode ajanı. Bu, küçük makineler için güzel bir model çünkü MoE + hibrit dikkat (küçük önbellek).