تضم مدونة مجتمع PyTorch الأخيرة مؤلف فريق SGLang، بياو (ستيفان) ه. حول كيف تطور SGLang نماذج هجينة من مامبا مع Attention مع تحسين كفاءة الذاكرة، وتخزين البادئات، وفك الترميز الافتراضي، وأداء الخدمة. 🖇️ اقرأ المدونة: #PyTorch #AIInfrastructure #SGLang #LLM