Minimax M2.1 (@MiniMax__AI) draaien met OpenCode (@opencode) en mlx_lm.server. Werkt behoorlijk goed op een M3 Ultra. Zodra de KV-cache warm is, is de promptverwerking vrij snel. En de token generatie is erg snel.