Uruchamianie pełnego GLM 4.7 (8-bit) na 2 x 512GB M3 Ultra Mac Studios Działa z prędkością 19,8 tok/sec z @exolabs MLX RDMA backend (dzięki @awnihannun) i równoległym przetwarzaniem tensorów