تصدر تينسنت WeDLM-8B-Instruct نموذج لغة انتشار يعمل بسرعة 3-6× من Qwen3-8B المحسنة ل vLLM في مهام التفكير الرياضي. -3-6× أسرع من Qwen3-8B المحسنة ل vLLM في مهام التفكير الرياضي - يتفوق على Qwen3-8B-Instruct الأساسي في معظم معايير الأداء - متوافقة مع ذاكرة التخزين المؤقت KV الأصلية (FlashAttention، PagedAttention، رسوم CUDA البيانية)