hanno costruito GLM-5 senza fare affidamento su grandi cluster NVIDIA, ma principalmente su hardware cinese domestico, che è meno maturo come ecosistema e, curiosamente, hanno giocato davvero in modo intelligente qui con ottimizzazioni su quantizzazione, kernel, pianificazione asincrona, parallelismo, ecc.