Mensaje de Gate News, 28 de abril — NVIDIA ha lanzado Nemotron 3 Nano Omni, un modelo multimodal de código abierto que presenta una arquitectura (MoE) de mixture-of-experts (30B-A3B) con compatibilidad con una ventana de contexto de 256K. El modelo unifica el procesamiento de entradas de video, audio, imagen y texto en un único marco.
En comparación con modelos multimodales de código abierto comparables, Nemotron 3 Nano Omni logra una mejora de 9x en el rendimiento, reduciendo significativamente los costos de inferencia y mejorando la escalabilidad. El modelo ya está disponible en Hugging Face, OpenRouter y NVIDIA NIM, y ha sido adoptado por empresas, incluyendo Aible, Applied Scientific Intelligence y H Company.