Kabar Gerbang, 28 April — NVIDIA telah merilis Nemotron 3 Nano Omni, sebuah model multimodal open-source yang menampilkan arsitektur mixture-of-experts 30B-A3B (MoE) dengan dukungan jendela konteks 256K. Model ini menyatukan pemrosesan input video, audio, gambar, dan teks dalam satu kerangka.
Dibandingkan dengan model multimodal open-source yang sebanding, Nemotron 3 Nano Omni mencapai peningkatan throughput 9x, secara signifikan menurunkan biaya inferensi dan meningkatkan skalabilitas. Model ini kini tersedia di Hugging Face, OpenRouter, dan NVIDIA NIM, serta telah diadopsi oleh perusahaan termasuk Aible, Applied Scientific Intelligence, dan H Company.