GLM-4.6V Serisi burada🚀 - GLM-4.6V (106B): 128K bağlamlı amiral gemisi vizyon-dil modeli - GLM-4.6V-Flash (9B): yerel ve düşük gecikmeli iş yükleri için ultra hızlı, hafif versiyon GLM vizyon model ailesinde ilk yerel Fonksiyon Çağrısı Ağırlık: Şimdi GLM-4.6V'yi deneyin: UPA: Teknoloji Blogu: API Fiyatlandırması (1 milyon token başı): - GLM-4.6V: $0.6 giriş / $0.9 çıkış - GLM-4.6V-Flash: Ücretsiz
GLM-4.6V, çeşitli türlerde çok modlu girdileri kabul edebilir ve otomatik olarak yüksek kaliteli, yapılandırılmış görsel-metin aralı içerik üretebilir.
GLM-4.6V, uçtan uca çoklu modlu arama ve analiz iş akışı sunarak modelin görsel algıdan çevrimiçi alıma, akıl yürütmeye ve nihai cevaba sorunsuz geçiş yapmasını sağlar.
GLM-4.6V'yi ön yüz geliştirme için optimize ettik ve "kod tasarımı" döngüsünü önemli ölçüde kısalttık.
GLM-4.6V, görsel kodlayıcısını 128K bağlam uzunluğuyla hizalamış, modele devasa bir bellek kapasitesi kazandırmaktadır. Pratikte, bu tek bir çıkarma geçişinde ~150 sayfa karmaşık belge, 200 slayt sayfası veya bir saatlik videoyu işlemeye eşdeğerdir.
Model, uzun videolarda küresel özetleme yapabilirken, tam bir futbol maçında gol olaylarını ve zaman damgalarını özetlemek gibi zamansal ipuçları üzerinde ince ayrıntılı akıl yürütme yeteneğini koruyabilir.
177,55K