Google DeepMind 發布 Gemma 4 12B,開源多模態模型,支援在 16GB GPU 記憶體上運行

Google DeepMind 今天發布 Gemma 4 12B,這是一款開源的多模態 AI 模型。這個 120 億參數模型提供的效能可與其更大型的 260 億 Mixture of Experts(混合專家)模型相當,同時所需記憶體少於一半,並且只要 16GB VRAM 就能在消費者筆電上運行,包括入門級的 MacBook Air M5 裝置。

Gemma 4 12B 是 Gemma 4 系列中第一個支援原生音訊輸入的中型模型。該模型採用輕量化架構,無需額外的視覺與音訊編碼器,因此能夠降低延遲並減少記憶體用量。它支援多步推理、Agent 工作流程,以及完全離線的本地推論。該模型在 Apache 2.0 授權下釋出,預訓練權重可在 Hugging Face 與 Kaggle 取得,並可透過 Google Cloud 平台部署,包括 Model Garden、Cloud Run 與 GKE。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆