🎉Gratulujeme týmu @Zai_org k uvedení GLM-4.6V a GLM-4.6V-Flash — přičemž day-0 poskytuje podporu ve vLLM Recipes pro týmy, které je chtějí provozovat na svých vlastních GPU. GLM-4.6V se zaměřuje na vysoce kvalitní multimodální uvažování s dlouhým kontextem a nativním voláním nástrojů/funkcí, zatímco GLM-4.6V-Flash je varianta 9B laděná pro nasazení s nižší latencí a menší kapacitou; náš nový vLLM Recipe přináší připravené konfigurace, multi-GPU návody a produkčně orientované výchozí nastavení. Pokud vytváříte inferenční služby a chcete mít ve svém stacku GLM-4.6V, začněte zde: