🎉GLM-4.6V ve GLM-4.6V-Flash'ın lansmanı nedeniyle @Zai_org ekibini tebrikler — kendi GPU'larında çalıştırmak isteyen ekipler için vLLM Tarifleri'nde 0. gün servis desteği var. GLM-4.6V, uzun bağlam ve yerel araç/fonksiyon çağrısı ile yüksek kaliteli çoklu modal akıl yürütmeye odaklanırken, GLM-4.6V-Flash daha düşük gecikme ve daha küçük tabanlı dağıtımlar için ayarlanmış bir 9B varyantıdır; yeni vLLM Tarifimiz çalışmaya hazır yapılandırmalar, çoklu GPU rehberliği ve üretim odaklı varsayılan ayarları sunar. Çıkarım hizmetleri kuruyorsanız ve GLM-4.6V yığınınıza eklemek istiyorsanız, buradan başlayın: