Nvidia 推出最强开源模型 Nemotron 3 Ultra!专注 AI 代理任务,效能狂飙 5 倍、降本 30%

晶片巨头輝达(NVIDIA)於今(4)日宣布推出全新开源旗艦模型「Nemotron 3 Ultra」。該模型專为长时间运行的 AI 代理(AI Agents)与複雜的多代理工作流量身打造,具備高达 5,500 亿總參數。透过導入混合架構与多項技術創新,Nemotron 3 Ultra 不僅在多項基準測試中表现優異,更帶来最高 5 倍的吞吐量提升,並能降低 30% 的代理任務成本。
(前情提要:Nvidia 砸 4 亿美元收購 Kumo AI!補齐「企业预測模型」拼圖,加速转型全端 AI 巨头)
(背景補充:Nvidia 結盟中国新創宇樹科技 Unitree!黄仁勳推「人形机器人 AI 平台」,強攻數十兆美元实體 AI 市场)

本文目錄

Toggle

  • 550 亿活躍參數,化身 AI 工作流的「大腦」
  • 五大技術創新:吞吐量暴增 5 倍、降本 30%
  • 完全开源,加速企业級 AI 应用落地

在人工智慧(AI)朝向高度自动化与複雜工作流邁进的趨勢下,「多代理系统(Multi-agent systems)」的运算成本与效率瓶頸,成为各大企业在導入 AI 时面臨的最大痛点。为解決此问題,輝达(NVIDIA)於 2026 年 6 月 4 日正式发布了 Nemotron 3 家族的旗艦級产品 —— Nemotron 3 Ultra

这是一款專为「长时间运行的 AI 代理」所设计的強大开源模型。在傳统的多代理工作流中,由於需要不斷重複規劃、调用工具、委派子代理以及維持冗长的上下文,往往会導致代币(Token)消耗量暴增,进而引发高昂成本与目標偏离的风险,而 Nemotron 3 Ultra 正是为克服这些挑戰而生。

550 亿活躍參數,化身 AI 工作流的「大腦」

Nemotron 3 Ultra 採用了混合專家(Mixture-of-Experts, MoE)架構,總參數規模高达 5,500 亿,但每次运算僅会啟动 550 亿的活躍參數,確保了極致的运作效率。在多代理工作流中,該模型被精準定位为「編排者(Orchestrator)」或前沿推理引擎,專门處理深層規劃、複雜綜合分析与逻辑验证等高负載任務,並將例行執行与工具调用交由轻量級模型负责。

效能方面,Nemotron 3 Ultra 在多項專注於 AI 代理的基準測試中大放異彩。例如,在代理生产力(PinchBench)中取得 91% 的高分,在长視野規劃(EnterpriseOps-Gym)与程式碼編寫(Terminal-Bench 2.0)也分別达到 40% 与 67% 的優異表现。儘管啟动的活躍參數较少,但其整體推理能力已超越或媲美 GLM 5.1、Kimi K2.6 与 Qwen3.5 等市场上主流的大型开源模型。

五大技術創新:吞吐量暴增 5 倍、降本 30%

为了实现如此強悍的效能与速度,輝达在 Nemotron 3 Ultra 中導入了五大核心技術創新。首先是「混合 Mamba-Transformer 層」,巧妙結合了 Mamba 的长序列處理效率与 Transformer 的精確事实召回能力。其次是支援「NVFP4 量化」,让單一模型權重可无縫部署於 Hopper、Blackwell 与 Ampere 架構 GPU 上,相较於傳统的 BF16 格式,在 Blackwell 上可提升高达 5 倍的吞吐量(输出速度)。

此外,模型还整合了 LatentMoE(針对複雜工作负載设计的高效專家路由)、多代币预測(MTP,一次前向傳递预測多个未来代币以提升长文本生成速度),以及多教師在線蒸餾(MOPD)等前沿技術。这些創新让模型在處理任務时的總代币消耗量顯著減少,进而將企业的代理任務成本降低了最高 30%。

完全开源,加速企业級 AI 应用落地

在訓練數據方面,Nemotron 3 Ultra 奠基於逾 10 兆代币的龐大预訓練基礎,並額外加入了超过 2,120 亿个领域特定的代币资料(包含法律文件、維基百科风格文本与最新的 GitHub 程式碼)。輝达強调,該模型是完全开源的,採用極具彈性的 OpenMDW-1.1 授權,並向社群开放完整的模型權重、訓練配方与资料管道。

目前,开发者已可在 Hugging Face、NVIDIA Build 及 NIM 等主流平台上取得並部署 Nemotron 3 Ultra。憑藉其卓越的长文本處理能力(在 Ruler @1M 測試中达 95%)与極高的成本效益,预期这款模型將成为企业推动客戶服務自动化、供应链管理、IT 安全防護与晶片设计验证等複雜实務应用的絕佳利器。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论