A executar o Minimax M2.1 (@MiniMax__AI) com OpenCode (@opencode) e mlx_lm.server. Funciona bastante bem num M3 Ultra. Uma vez que o cache KV está aquecido, o processamento do prompt é bastante rápido. E a geração de tokens é muito rápida.