韓國電信推出了 Mi:dm K 2.5 Pro,這是一個專有的推理模型,在人工分析智能指數上得分 48
主要基準測試要點:
➤ 工具使用的優勢:Mi:dm K 2.5 Pro 在 τ²-Bench Telecom 上得分 87%,顯示出在代理工具使用工作流程中的強大表現。Mi:dm K 2.5 Pro 在這一類別中排名靠前,得分與 Gemini 3 Pro Preview 和 Claude Opus 4.5 相似。
➤ 韓語優勢:Mi:dm K 2.5 Pro 在全球 MMLU Lite 多語言指數中對韓語的得分為 83%,大致與 gpt-oss-120b 以及 Naver 的 HyperCLOVA X SEED Think 在這一類別中的表現相當。這反映了韓國 AI 實驗室在開發針對主要韓語環境和本地用例優化的模型方面的更廣泛趨勢。
➤ 相對較高的令牌使用量:與同一智能層級的其他模型相比,Mi:dm K 2.5 Pro 顯示出相對較高的令牌使用量,在人工分析智能套件中使用了約 90M 的推理令牌。這與 EXAONE 4.0 32B(96M 推理令牌)相當,後者也是一個韓國模型。
➤ 公共訪問有限:Mi:dm K 2.5 Pro 是一個專有模型,目前沒有公開可用的端點。相反,韓國電信主要打算將此模型打包進產品中,並利用此模型為 KT 的客戶提供服務。
請參見下方的進一步分析