小米的 MiMo-V2.5 系列开源:1T 参数,相较 GPT-5.4 令牌效率更优

Gate News message, April 27 — Xiaomi’s MiMo team has open-sourced the MiMo-V2.5 series of large language models under MIT license, supporting commercial deployment, continued training, and fine-tuning. Both models feature a 1 million token context window. MiMo-V2.5-Pro is a pure-text mixture-of-experts (MoE) model with 1.02 trillion total parameters and 42 billion active parameters, while MiMo-V2.5 is a native multimodal model with 310 billion total parameters and 15 billion active parameters, supporting text, image, video, and audio understanding.

MiMo-V2.5-Pro targets complex agent and programming tasks. In ClawEval benchmarks, it achieved 64% Pass@3 while consuming approximately 70,000 tokens per task trajectory—40% to 60% fewer tokens than Claude Opus, Gemini 3.1 Pro, and GPT-5.4. The model scored 78.9 on SWE-bench Verified. In a demonstration, V2.5-Pro independently implemented a complete SysY-to-RISC-V compiler for a Peking University compiler course project in 4.3 hours with 672 tool calls, achieving a perfect score of 233/233 on hidden test sets.

MiMo-V2.5 is designed for multimodal agent scenarios, equipped with a dedicated vision encoder (729 million parameters) and audio encoder (261 million parameters), scoring 62.3 on the Claw-Eval general subset. Both models employ a hybrid architecture combining sliding window attention (SWA) and global attention (GA), paired with a 3-layer multi-token prediction (MTP) module for accelerated inference. Model weights are available on Hugging Face.

Alongside the open-source release, the MiMo team launched the “Orbit Quadrillion Token Creator Incentive Program,” offering 100 quadrillion tokens free over 30 days to global users. Individual developers, teams, and enterprises can apply via the program page with an evaluation cycle of approximately 3 business days; approved benefits are distributed as Token Plans or direct credits, compatible with tools like Claude Code and Cursor.

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

《时代》杂志评选最具影响力的 10 家人工智能公司;字节跳动、智谱、阿里巴巴入选

Gate News 消息,4 月 28 日——《时代》杂志已公布其“2026 年最具影响力的 10 家人工智能公司”榜单,强调对行业、技术路径以及社会的全面影响,而不是仅关注模型能力。 入选公司包括字节跳动、Amazon,

GateNews8 分钟前

中国中央委员会启动全面“AI+”倡议,发展智慧型经济

Gate 新闻消息,4 月 28 日——中国共产党中央委员会政治局于 4 月 28 日召开会议,分析当前经济形势并部署工作。会议强调,需要全面

GateNews34 分钟前

腾讯云升级企业级智能体(Agent)能力,推出多款人工智能(AI)产品

Gate 新闻消息,4月28日——腾讯云在4月28日于重庆举办的2026腾讯云城市峰会上,宣布对其全栈企业级智能体(Agent)产品能力进行全面升级。公司发布了多款新产品,包括 ClawPro 私有云版本、ADP

GateNews1小时前

Microsoft 与 OpenAI 重新签署协议:取消排他性、移除 AGI 条款

根据 Microsoft 官方博客 4 月 27 日公告,Microsoft 与 OpenAI 正式宣布重签合作协议,重大改动三项:移除 OpenAI 对 Microsoft 云端的排他性、废除过去最具争议的「AGI 达成触发条款」、IP 授权延长至 2032 年但改为非排他。对 AI 产业而言,这是 OpenAI 自 2019 年首次接受 Microsoft 投资以来,双方关系结构性重塑的关键时刻。 排他性结束:OpenAI 可选择任何云端服务 在新协议下,OpenAI 不再被迫只能在 Microsoft

鏈新聞abmedia1小时前

CleanSpark CEO Warns of 20x Cost Increase Converting Bitcoin Mines to AI Data Centers

Gate 新闻消息,4 月 28 日——CleanSpark 首席执行官 Matt Schultz 警告称,在比特币 2026 大会上,将比特币挖矿业务转换为 AI 数据中心会显著提高基础设施成本。每兆瓦的建设成本从约 50 万美元飙升至 1000 万至 1200 万美元,增幅超过 20 倍。人员配置需求也随之大幅上升,从大约每 10MW 1 人提高到约每 10MW 8 人。 Schultz 还提醒称,云服务提供商会施加苛刻的合同条款,若交付延迟而产生的处罚可能严重到足以抹掉一整年的合同收入。他建议业界仔细评估执行风险,而不应只关注签署公告带来的短期股价上涨。 CleanSpark 的策略是先部署比特币挖矿,以帮助本地公用事业单位将闲置发电能力变现并建立合作关系,然后再转向 AI 数据中心开发。该方案使公司得以在怀俄明州的切yenne 赢得一个 100MW 项目,并击败了一家万亿美元级的科技巨头。Schultz 强调,比特币挖矿的可中断特性使其能够在 AI 数据中心低需求时期填补空档,帮助电力系统消化可再生能源的波动——因此它是公用事业单位的理想合作伙伴。

GateNews1小时前

Cadence因AI芯片需求上调2026年营收预期至61.3亿-62.3亿美元

Gate 新闻消息,4月28日——总部位于加州的芯片设计软件制造商Cadence Design Systems在4月27日上调了其2026财年营收预期,理由是用于构建AI处理器以及更复杂芯片的工具需求强劲。公司目前预计营收为6.13亿美元

GateNews1小时前
评论
0/400
暂无评论