微軟 Build 發布 7 款 AI 模型,Token 用量較競品少 60%

微軟Build AI模型

微軟(Microsoft)於 6 月 Build 大會宣布推出 7 款新 AI 模型,涵蓋推理、程式碼、圖片、轉錄和語音領域。在 4 項核心編程基準測試中,MAI-Code-1-Flash 全數優於 Claude Haiku 4.5,並在 SWE-Bench Verified 上 Token 使用量減少最高達 60%。

7 款模型清單:五大領域全面覆蓋

微軟 Build 大會已公開完整名稱的 6 款模型為:MAI Thinking-1(推理)、MAI Code-1-Flash(程式碼)、MAI Image-2.5(圖片)、MAI Image-2.5-Flash(圖片精簡版)、MAI Transcribe-1.5(轉錄)及一款語音模型;第 7 款模型的完整名稱於現有報道中尚未完整披露。微軟聲明旗艦推理模型 MAI-Thinking-1 在 STEM 推理和編碼任務上與同類模型具有競爭力,未提供具體基準數據。

MAI-Code-1-Flash vs Claude Haiku 4.5:4 項基準測試數據

MAI-Code-1-Flash 在以下 4 項基準測試中通過率均高於 Claude Haiku 4.5,同時使用更少 Token:

SWE-Bench Pro:MAI-Code-1-Flash 51.2% vs Claude Haiku 4.5 35.2%,領先 16 分

SWE-Bench Verified:解決複雜問題的 Token 使用量減少最高達 60%

IF Bench(精確指令追蹤):MAI-Code-1-Flash 領先 28.9 分

Advanced IF:MAI-Code-1-Flash 領先 14.5 分

微軟官方文件指出,MAI-Code-1-Flash 在 Einstellung 陷阱等核心對抗性類別中的準確率仍低於 50%,屬已識別的現有改進空間。

MAI-Code-1-Flash 目前可用範圍:個人用戶無需額外設定

MAI-Code-1-Flash 現已在 VS Code 的 GitHub Copilot 個人用戶版本中推出,可透過模型選擇器直接使用,或由 Copilot 自動選擇器自動路由。模型採用自適應解長度控制,對簡單請求保持簡潔,對複雜任務投入更多推理資源。MAI-Code-1-Flash 的企業版及其他用戶群的部署時程目前尚未公布。

常見問題

微軟 Build 2026 發布的 7 款新模型分別是什麼?

已公開完整名稱的包括 MAI Thinking-1、MAI Code-1-Flash、MAI Image-2.5、MAI Image-2.5-Flash、MAI Transcribe-1.5 及一款語音相關模型,共 6 款;第 7 款模型的完整名稱於現有官方報道中尚未完整揭露。

MAI-Code-1-Flash 的 60% Token 減少如何實現?

微軟聲明該模型採用自適應解長度控制訓練,根據任務複雜程度自動調整反應深度。微軟在 SWE-Bench Verified 測試中的結果顯示,解決複雜問題時的 Token 使用量最高可減少 60%。

MAI-Code-1-Flash 目前對哪些用戶開放,企業版時程為何?

截至 2026 年 6 月,MAI-Code-1-Flash 已對 VS Code GitHub Copilot 個人用戶開放,無需額外設定。微軟尚未公布企業版或其他用戶群的部署時程。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆