Laut Beating hat Google Gemma 4 12B veröffentlicht, eine neue Modellgröße in der Gemma-4-Familie, die darauf ausgelegt ist, multimodale KI-Agenten lokal auf Consumer-Laptops mit 16 GB RAM laufen zu lassen. Das 12B-Parameter-Modell nutzt eine encoderfreie multimodale Architektur, die Text- und Bild-Eingaben unterstützt und so eine Leistungslücke zwischen den kleineren und den größeren Modellen in der Modellreihe schließt.
Gleichzeitig hat Google sein LiteRT-LM-Tool zur lokalen Inferenz mit OpenAI-API-Kompatibilität aktualisiert und ermöglicht damit Entwicklern, Tools wie Continue, Aider und Open WebUI direkt mit einer lokal laufenden Instanz von Gemma 4 12B zu verbinden, ohne auf cloudbasierte Modelle angewiesen zu sein.