Google DeepMind lanzó hoy Gemma 4 12B, un modelo de IA multimodal de código abierto. El modelo de 12 mil millones de parámetros ofrece un rendimiento comparable al de su modelo 26B Mixture of Experts más grande, pero requiere menos de la mitad de la memoria, y puede ejecutarse en portátiles de consumo con solo 16GB de VRAM, incluidos dispositivos MacBook Air M5 de nivel básico.
Gemma 4 12B es el primer modelo de tamaño intermedio de la serie Gemma 4 en admitir entrada de audio nativa. El modelo cuenta con una arquitectura ligera sin codificadores separados de visión y audio, lo que permite menor latencia y un menor consumo de memoria. Admite razonamiento de varios pasos, flujos de trabajo de Agent y inferencia local totalmente sin conexión. El modelo se publica bajo la licencia Apache 2.0, con pesos preentrenados disponibles en Hugging Face y Kaggle, y puede desplegarse mediante plataformas de Google Cloud, incluidos Model Garden, Cloud Run y GKE.