Запускаю Minimax M2.1 (@MiniMax__AI) з OpenCode (@opencode) та mlx_lm.server. Досить добре працює на M3 Ultra. Коли кеш KV нагрівається, обробка запитів відбувається досить швидко. І генерація токенів дуже швидка.