Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La serie GLM-4.6V ya está aquí🚀
- GLM-4.6V (106B): modelo de lenguaje visual insignia con contexto 128K
- GLM-4.6V-Flash (9B): versión ultrarrápida y ligera para cargas de trabajo locales y de baja latencia
Primera llamada de función nativa en la familia de modelos de visión GLM
Pesos:
Prueba ahora el GLM-4.6V:
API:
Blog tecnológico:
Fijación de precios de la API (por 1M de tokens):
- GLM-4.6V: 0,6 $ de entrada / 0,9 $ de salida
- GLM-4.6V-Flash: Gratis

GLM-4.6V puede aceptar entradas multimodales de varios tipos y generar automáticamente contenido de alta calidad y estructurado intercalado entre imagen-texto.
GLM-4.6V ofrece un flujo de trabajo multimodal de búsqueda y análisis de extremo a extremo, permitiendo que el modelo pase sin problemas de la percepción visual a la recuperación en línea, al razonamiento y a la respuesta final.
Hemos optimizado el GLM-4.6V para el desarrollo frontend, acortando significativamente el ciclo de "diseño según el código".
El GLM-4.6V alinea su codificador visual con una longitud contextual de 128K, lo que le da al modelo una enorme capacidad de memoria. En la práctica, esto equivale a procesar ~150 páginas de documentos complejos, 200 páginas de diapositivas o un vídeo de una hora en una sola pasada de inferencia.
El modelo puede realizar resumen global en vídeos largos manteniendo la capacidad de realizar razonamientos detallados sobre pistas temporales, como resumir eventos de gol y marcas de tiempo en un partido completo de fútbol.
142.47K
Populares
Ranking
Favoritas

