Google DeepMind veröffentlicht Gemma 4 12B, ein Open-Source-Multimodal-Modell, das auf 16-GB-GPU-Speicher läuft

Google DeepMind hat heute Gemma 4 12B veröffentlicht – ein Open-Source-multimodales KI-Modell. Das 12-Milliarden-Parameter-Modell bietet eine Leistung, die mit dem größeren 26B Mixture of Experts-Modell vergleichbar ist, benötigt dabei jedoch weniger als die Hälfte des Speichers. Es kann auf Consumer-Laptops mit nur 16GB VRAM laufen – einschließlich Einsteiger-Geräten wie dem MacBook Air M5.

Gemma 4 12B ist das erste mittelgroße Modell in der Gemma-4-Serie, das nativ Audio-Input unterstützt. Das Modell verfügt über eine schlanke Architektur ohne separate Vision- und Audio-Encoder, wodurch die Latenz sinkt und der Speicherverbrauch reduziert wird. Es unterstützt mehrstufiges Reasoning, Agent-Workflows und vollständig Offline-Lokal-Inferenz. Das Modell wird unter der Apache-2.0-Lizenz veröffentlicht, mit vortrainierten Gewichten auf Hugging Face und Kaggle, und kann über Google-Cloud-Plattformen bereitgestellt werden, darunter Model Garden, Cloud Run und GKE.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare