GLM-4.6V Serie is hier🚀 - GLM-4.6V (106B): vlaggenschip visie-taalmodel met 128K context - GLM-4.6V-Flash (9B): ultra-snelle, lichte versie voor lokale en low-latency workloads Eerste native Function Calling in de GLM visie model familie Gewichten: Probeer GLM-4.6V nu: API: Tech Blog: API Prijzen (per 1M tokens): - GLM-4.6V: $0.6 input / $0.9 output - GLM-4.6V-Flash: Gratis
GLM-4.6V kan multimodale invoer van verschillende types accepteren en automatisch hoogwaardige, gestructureerde inhoud met afbeelding-tekstinterleaving genereren.
GLM-4.6V biedt een end-to-end multimodale zoek- en analysetoepassing, waardoor het model naadloos kan overgaan van visuele waarneming naar online ophalen, naar redeneren en naar het uiteindelijke antwoord.
We hebben GLM-4.6V geoptimaliseerd voor frontend-ontwikkeling, waardoor de "ontwerp naar code" cyclus aanzienlijk is verkort.
GLM-4.6V stemt zijn visuele encoder af op een contextlengte van 128K, wat het model een enorme geheugencapaciteit geeft. In de praktijk komt dit overeen met het verwerken van ~150 pagina's complexe documenten, 200 dia-pagina's of een video van een uur in één inferentiepass.
Het model kan globale samenvattingen maken van lange video's, terwijl het de mogelijkheid behoudt om gedetailleerde redeneringen te maken op basis van temporele aanwijzingen, zoals het samenvatten van doelgebeurtenissen en tijdstempels in een volledige voetbalwedstrijd.
177,56K