基準測試很酷,結果更酷。 期待在 flowith canvas 上運行 deepseek-v3.2,並將其與其他模型進行並排比較。