A Google DeepMind lança a Gemma 4 12B, modelo multimodal open-source executável em memória gráfica de 16GB

A Google DeepMind lançou hoje o Gemma 4 12B, um modelo de IA multimodal open-source. O modelo com 12 mil milhões de parâmetros oferece um desempenho comparável ao do seu modelo Mixture of Experts de 26B, exigindo ao mesmo metade da memória, e pode ser executado em portáteis de consumo com apenas 16GB de VRAM, incluindo dispositivos entry-level MacBook Air M5.

O Gemma 4 12B é o primeiro modelo intermédio da série Gemma 4 a suportar entrada de áudio nativa. O modelo tem uma arquitectura leve sem codificadores separados de visão e de áudio, permitindo menor latência e menor consumo de memória. Suporta raciocínio em múltiplos passos, fluxos de trabalho de Agent e inferência local totalmente offline. O modelo é disponibilizado sob a licença Apache 2.0, com pesos pré-treinados disponíveis no Hugging Face e no Kaggle, e pode ser implementado através de plataformas da Google Cloud, incluindo Model Garden, Cloud Run e GKE.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário