Google DeepMind hat heute Gemma 4 12B veröffentlicht – ein Open-Source-multimodales KI-Modell. Das 12-Milliarden-Parameter-Modell bietet eine Leistung, die mit dem größeren 26B Mixture of Experts-Modell vergleichbar ist, benötigt dabei jedoch weniger als die Hälfte des Speichers. Es kann auf Consumer-Laptops mit nur 16GB VRAM laufen – einschließlich Einsteiger-Geräten wie dem MacBook Air M5.
Gemma 4 12B ist das erste mittelgroße Modell in der Gemma-4-Serie, das nativ Audio-Input unterstützt. Das Modell verfügt über eine schlanke Architektur ohne separate Vision- und Audio-Encoder, wodurch die Latenz sinkt und der Speicherverbrauch reduziert wird. Es unterstützt mehrstufiges Reasoning, Agent-Workflows und vollständig Offline-Lokal-Inferenz. Das Modell wird unter der Apache-2.0-Lizenz veröffentlicht, mit vortrainierten Gewichten auf Hugging Face und Kaggle, und kann über Google-Cloud-Plattformen bereitgestellt werden, darunter Model Garden, Cloud Run und GKE.