Google DeepMind lanza Gemma 4 12B, modelo multimodal de código abierto que se ejecuta en memoria GPU de 16GB

Google DeepMind lanzó hoy Gemma 4 12B, un modelo de IA multimodal de código abierto. El modelo de 12 mil millones de parámetros ofrece un rendimiento comparable al de su modelo 26B Mixture of Experts más grande, pero requiere menos de la mitad de la memoria, y puede ejecutarse en portátiles de consumo con solo 16GB de VRAM, incluidos dispositivos MacBook Air M5 de nivel básico.

Gemma 4 12B es el primer modelo de tamaño intermedio de la serie Gemma 4 en admitir entrada de audio nativa. El modelo cuenta con una arquitectura ligera sin codificadores separados de visión y audio, lo que permite menor latencia y un menor consumo de memoria. Admite razonamiento de varios pasos, flujos de trabajo de Agent y inferencia local totalmente sin conexión. El modelo se publica bajo la licencia Apache 2.0, con pesos preentrenados disponibles en Hugging Face y Kaggle, y puede desplegarse mediante plataformas de Google Cloud, incluidos Model Garden, Cloud Run y GKE.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios