GLM-4.7-8bit (350GB) pyörii 19 toks/s kahdella M3 Ultra 512GB -kameralla käyttäen Tensor Parallelismia EXO - MLX:llä, kun taas 14 toks/s yhdellä solmulla. 🚀 Nyt kontekstivertailu ja sitten OpenCode-testit 🔥 Huomautus: tämä on lähteistä, jouduin muuttamaan asioita ajaakseni sen.