Tencent, WeDLM-8B-Instruct sürümünü başlattı Matematiksel akıl yürütme görevlerinde vLLM optimize edilmiş Qwen3-8B'den 3-6× daha hızlı çalışan bir difüzyon dil modeli. -3-6× matematiksel akıl yürütme görevlerinde vLLM optimize edilmiş Qwen3-8B'den daha hızlı - Çoğu benchmark'ta temel Qwen3-8B-Instruct'ten daha iyi performans gösterir - Yerel KV önbellek uyumlu (FlashAttention, PagedAttention, CUDA Grafikleri)