Google DeepMind 今天發布 Gemma 4 12B,這是一款開源的多模態 AI 模型。這個 120 億參數模型提供的效能可與其更大型的 260 億 Mixture of Experts(混合專家)模型相當,同時所需記憶體少於一半,並且只要 16GB VRAM 就能在消費者筆電上運行,包括入門級的 MacBook Air M5 裝置。
Gemma 4 12B 是 Gemma 4 系列中第一個支援原生音訊輸入的中型模型。該模型採用輕量化架構,無需額外的視覺與音訊編碼器,因此能夠降低延遲並減少記憶體用量。它支援多步推理、Agent 工作流程,以及完全離線的本地推論。該模型在 Apache 2.0 授權下釋出,預訓練權重可在 Hugging Face 與 Kaggle 取得,並可透過 Google Cloud 平台部署,包括 Model Garden、Cloud Run 與 GKE。