谷歌 DeepMind 发布 Gemma 4 12B,开源多模态模型可在 16GB GPU 内存上运行

Google DeepMind 今天发布 Gemma 4 12B,这是一个开源多模态 AI 模型。该 120 亿参数模型在性能上可与其更大 260 亿参数 Mixture of Experts 模型相当,同时所需内存少于一半,并且仅需 16GB 显存即可在消费级笔记本电脑上运行,包括入门级 MacBook Air M5 设备。

Gemma 4 12B 是 Gemma 4 系列中首个支持原生音频输入的中型模型。该模型采用轻量化架构,不包含独立的视觉与音频编码器,从而实现更低延迟并减少内存消耗。它支持多步推理、Agent 工作流,以及完全离线的本地推理。该模型在 Apache 2.0 许可下发布,预训练权重可在 Hugging Face 和 Kaggle 获取,并可通过 Google Cloud 平台部署,包括 Model Garden、Cloud Run 和 GKE。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论