حصلت على دفعات مستمرة تعمل مع SSMs في mlx-lm. إليك أربعة وكلاء OpenCode يشغلون Nemotron Nano من Nvidia في نفس الوقت على معالج M4 Max بسعة 64GB. هذا نموذج جيد للأجهزة الصغيرة لأنه مزيج من MoE + اهتمام هجين (ذاكرة تخزين مؤقتة صغيرة).