Бенчмарки MLX уже доступны, и я не ожидал таких результатов. M5 Max просто разрывает M3 Ultra, несмотря на большее количество GPU-ядр и более высокую пропускную способность памяти. Производительность при вычислениях значительно быстрее (до 2x) благодаря новым нейронным ускорителям M5, но также и декодирование, зависящее от памяти, быстрее, если вы используете модели MoE вместо плотных моделей. M5 Ultra будет настоящим монстром. Не могу дождаться, чтобы увидеть эти цифры.