تحديث تطوير Moltghost بحثت عن Kimi K2 كخيار موديل محلي. إنه نموذج MoE بمعاملة 1T — حتى مع التكميم، يحتاج إلى قرص 500GB+ وذاكرة VRAM بسعة 200GB+. وحدات معالجة الرسوميات الفردية لدينا تصل إلى 45 جيجابايت، لذا هذا غير ممكن على الأجهزة الحالية. حاليا، نستخدم نماذج تناسب وحدات معالجة رسومات واحدة مثل Phi4-Mini و Qwen3 8B، مع نماذج منطقية مثل DeepSeek-R1 التي تأتي بعد ذلك. دعم مجموعات الرسومات المتعددة ضمن خارطة الطريق. على جانب النشر، ارتفع معدل التشغيلات من 75 إلى 19 ثانية. قمنا بدمج أوزان OpenClaw ونماذج اللغة الكبيرة في صورة Docker، وأزلنا حلقة git pull وإعادة البناء، وقمت بتشغيل التشغيل بشكل متوازي. تم اختبارها عبر ثلاثة أنواع من وحدات معالجة الرسوميات: L4 → 18 ثانية بوتستراب، ~2:47 إجمالا A5000 → 19s bootstrap، ~6:18 إجمالا A40 → 18 ثانية bootstrap، ~5:08 إجمالا انقر لتشغيل الوكيل المباشر خلال أقل من 3 دقائق على L4. عنق الزجاجة المتبقي هو ال container init — حيث يقوم RunPod بسحب واستخراج صورة Docker بسعة 1.3GB إلى عقدة GPU قبل أن يبدأ الكود حتى في العمل. يستغرق هذا من 2 إلى 5 دقائق حسب العقدة التي تهبط عليها وما إذا كانت الصورة مخزنة مسبقا. الخطوة التالية هي تسجيل قوالب RunPod لتخزين الصور مسبقا عبر العقد، بهدف تقليل إجمالي النشر إلى أقل من دقيقة واحدة. كل هذا لا يزال يعمل على التطوير المحلي. اختيار النماذج المتعددة لم يبدأ الإنتاج بعد — لا يزال علينا إعادة بناء صورة Qwen3 8B لتتناسب مع النظام المحدث قبل طرحها للجمهور.