Запуск Minimax M2.1 (@MiniMax__AI) с OpenCode (@opencode) и mlx_lm.server. Работает довольно хорошо на M3 Ultra. Как только кеш KV разогреется, обработка запросов проходит довольно быстро. А генерация токенов очень быстрая.