
微軟(Microsoft)於 6 月 Build 大會宣布推出 7 款新 AI 模型,涵蓋推理、程式碼、圖片、轉錄和語音領域。在 4 項核心編程基準測試中,MAI-Code-1-Flash 全數優於 Claude Haiku 4.5,並在 SWE-Bench Verified 上 Token 使用量減少最高達 60%。
7 款模型清單:五大領域全面覆蓋
微軟 Build 大會已公開完整名稱的 6 款模型為:MAI Thinking-1(推理)、MAI Code-1-Flash(程式碼)、MAI Image-2.5(圖片)、MAI Image-2.5-Flash(圖片精簡版)、MAI Transcribe-1.5(轉錄)及一款語音模型;第 7 款模型的完整名稱於現有報道中尚未完整披露。微軟聲明旗艦推理模型 MAI-Thinking-1 在 STEM 推理和編碼任務上與同類模型具有競爭力,未提供具體基準數據。
MAI-Code-1-Flash vs Claude Haiku 4.5:4 項基準測試數據
MAI-Code-1-Flash 在以下 4 項基準測試中通過率均高於 Claude Haiku 4.5,同時使用更少 Token:
SWE-Bench Pro:MAI-Code-1-Flash 51.2% vs Claude Haiku 4.5 35.2%,領先 16 分
SWE-Bench Verified:解決複雜問題的 Token 使用量減少最高達 60%
IF Bench(精確指令追蹤):MAI-Code-1-Flash 領先 28.9 分
Advanced IF:MAI-Code-1-Flash 領先 14.5 分
微軟官方文件指出,MAI-Code-1-Flash 在 Einstellung 陷阱等核心對抗性類別中的準確率仍低於 50%,屬已識別的現有改進空間。
MAI-Code-1-Flash 目前可用範圍:個人用戶無需額外設定
MAI-Code-1-Flash 現已在 VS Code 的 GitHub Copilot 個人用戶版本中推出,可透過模型選擇器直接使用,或由 Copilot 自動選擇器自動路由。模型採用自適應解長度控制,對簡單請求保持簡潔,對複雜任務投入更多推理資源。MAI-Code-1-Flash 的企業版及其他用戶群的部署時程目前尚未公布。
常見問題
微軟 Build 2026 發布的 7 款新模型分別是什麼?
已公開完整名稱的包括 MAI Thinking-1、MAI Code-1-Flash、MAI Image-2.5、MAI Image-2.5-Flash、MAI Transcribe-1.5 及一款語音相關模型,共 6 款;第 7 款模型的完整名稱於現有官方報道中尚未完整揭露。
MAI-Code-1-Flash 的 60% Token 減少如何實現?
微軟聲明該模型採用自適應解長度控制訓練,根據任務複雜程度自動調整反應深度。微軟在 SWE-Bench Verified 測試中的結果顯示,解決複雜問題時的 Token 使用量最高可減少 60%。
MAI-Code-1-Flash 目前對哪些用戶開放,企業版時程為何?
截至 2026 年 6 月,MAI-Code-1-Flash 已對 VS Code GitHub Copilot 個人用戶開放,無需額外設定。微軟尚未公布企業版或其他用戶群的部署時程。