Używając nowego serwera MLX_server_benchmark do ciągłego pakowania, aby uruchomić MiniMax M2.1 lokalnie na M3 Ultra. 4bit: 1 zapytanie: 48 t/s 32 zapytania: 220 t/s 🔥 8bit: 1 zapytanie: 36 t/s 32 zapytania: 150t/s 🔥