Tencent випускає WeDLM-8B-Instruct Модель дифузійної мови, яка працює на 3-6× швидше, ніж оптимізований для vLLM Qwen3-8B у завданнях математичного мислення. -3-6× швидше, ніж оптимізований для vLLM Qwen3-8B у завданнях математичного мислення - Перевершує базовий Qwen3-8B-Instruct на більшості бенчмарків - Сумісний з нативним кешом KV (FlashAttention, PagedAttention, CUDA-графи)