Nuestro último blog comunitario de PyTorch del equipo SGLang explica cómo SGLang avanza en modelos híbridos Mamba y Attention con una mejor eficiencia de memoria, caché de prefijos, decodificación especulativa y rendimiento de servicio. 🖇️Lee el blog: #PyTorch #AIInfrastructure #SGLang #LLM