在 M3 Ultra 上使用 MLX 進行 Qwen3-Next-80B-A3B 的基準測試。 q5 和 q6 在 MMLU Pro 上表現優於 bf16 🤷🏻‍♂️ 我嘗試了 q8 和 q6 兩次,結果相同。🤔 我會重新嘗試 fp16。