Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

La serie GLM-4.6V ya está aquí🚀 - GLM-4.6V (106B): modelo de lenguaje visual insignia con contexto 128K - GLM-4.6V-Flash (9B): versión ultrarrápida y ligera para cargas de trabajo locales y de baja latencia Primera llamada de función nativa en la familia de modelos de visión GLM Pesos: Prueba ahora el GLM-4.6V: API: Blog tecnológico: Fijación de precios de la API (por 1M de tokens): - GLM-4.6V: 0,6 $ de entrada / 0,9 $ de salida - GLM-4.6V-Flash: Gratis

GLM-4.6V puede aceptar entradas multimodales de varios tipos y generar automáticamente contenido de alta calidad y estructurado intercalado entre imagen-texto.

GLM-4.6V ofrece un flujo de trabajo multimodal de búsqueda y análisis de extremo a extremo, permitiendo que el modelo pase sin problemas de la percepción visual a la recuperación en línea, al razonamiento y a la respuesta final.

Hemos optimizado el GLM-4.6V para el desarrollo frontend, acortando significativamente el ciclo de "diseño según el código".

El GLM-4.6V alinea su codificador visual con una longitud contextual de 128K, lo que le da al modelo una enorme capacidad de memoria. En la práctica, esto equivale a procesar ~150 páginas de documentos complejos, 200 páginas de diapositivas o un vídeo de una hora en una sola pasada de inferencia.

El modelo puede realizar resumen global en vídeos largos manteniendo la capacidad de realizar razonamientos detallados sobre pistas temporales, como resumir eventos de gol y marcas de tiempo en un partido completo de fútbol.

142.47K

Populares

Ranking

Favoritas