螞蟻集團 Ling-2.6-flash 模型開源:1040 億參數、啟用 74 億參數,達成多項最新最先進(SOTA)基準

Gate 新聞訊息,4 月 29 日——螞蟻集團的 Ling-2.6-flash 模型權重現已開源釋出;此前該模型的權重僅可透過 API 使用。該模型具備 1040 億(104 billion)總參數,每次推論啟用 74 億(7.4 billion)參數,並提供 256K 上下文視窗,且採用 MIT 授權。HuggingFace 與 ModelScope 提供 BF16、FP8 與 INT4 精度版本。

Ling-2.6-flash 相較 Ling 2.0 引入混合線性注意力改進(hybrid linear attention),將原本的 GQA 升級為「1:7 MLA + Lightning Linear」混合架構,並結合高度稀疏的 MoE。推論效率顯著優於同類模型:在 4x H20 GPU 上,峰值生成速度達到 340 tokens/s;預填充(prefill)與解碼(decode)的吞吐量約為可比開源模型的 4 倍。與代理(Agent)相關的基準測試顯示強勁表現:BFCL-V4、TAU2-bench、SWE-bench Verified (61.2%)、Claw-Eval 與 PinchBench 均達到或接近最新最先進(SOTA)水準。在完整的 Artificial Analysis 基準測試套件中,總 token 消耗僅為 15 million。在 AIME 2026 上,該模型得分為 73.85%。

螞蟻集團官方網站亦列出了 Ling-2.6-1T (trillion-parameter 旗艦版本) 與 Ling-2.6-mini (lightweight 版本);不過截至發布之時,其權重仍未在 HuggingFace 上釋出,僅提供 flash 系列供下載。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

2025 年全球 AR 智慧眼鏡出貨量飆升 98%,由 Meta 的 Ray-Ban Display 與波導技術推動

門戶新聞訊息,4月29日——根據 Counterpoint Research 的數據,全球擴增實境 (AR) 智慧眼鏡出貨量在 2025 年飆升 98%,下半年出貨量則按年增長 148%。增長動能來自擴大產出

GateNews13分鐘前

傳奇對沖基金交易員談美股本益比:未來幾年買大盤的人要獲利很難

對沖基金經理 Paul Tudor Jones(瓊斯)接受訪談,警告 AI 監管空白可能帶來災難性後果,因其破壞—迭代模式風險前所未見。另指出美股市值占GDP比重達252%、本益比偏高,長期投資大盤難獲利;他以拳擊比喻交易機會稀少,呼籲全球協作制定 AI 監管。

鏈新聞abmedia15分鐘前

Cognition 將新加坡設為亞太總部,著眼區域擴張

Gate 新聞訊息,4 月 29 日——Cognition,這家由 Devin 背後的 AI 編程創業公司,宣布在 4 月 29 日將新加坡設立為其亞太(Asia-Pacific)總部,以負責監督其在東南亞、澳洲、印度和南韓的區域擴張。 Richard Spence 將負責領導亞太(APAC)營運

GateNews1小時前

Google 與五角大廈簽署機密 AI 協議,員工公開信反對

根據 The Information 於 4 月 28 日報道,Google 已簽署協議,將向美國五角大廈提供用於機密工作的人工智慧(AI)模型。《紐約時報》引述知情人士稱,該協議允許美國國防部將 Google 的 AI 用於合法政府用途,性質與五角大廈上月與 OpenAI 及 xAI 簽署機密 AI 部署協議相同。

Market Whisper1小時前

a16z Crypto 研究報告:AI 代理 DeFi 漏洞利用率達 70%

根據 a16z Crypto 於 4 月 29 日發布的研究報告,AI 代理在配備結構化領域知識的條件下,重現以太坊價格操縱漏洞的成功率達 70%;在無任何領域知識的沙盒環境中,成功率僅為 10%。報告同時記錄了 AI 代理獨立繞過沙盒限制存取未來交易資訊的案例,及代理在建立多步驟可盈利攻擊方案時的系統性失敗模式。

Market Whisper1小時前
留言
0/400
暫無留言