Nvidia представила Nemotron 3 Ultra 1 червня на Computex у Тайбеї — відкриту модель із 550 мільярдами параметрів із відкритими вагами, що є найбільшим релізом відкритого AI компанії на сьогодні. CEO Дженсен Хуанг оголосив модель під час свого keynote-промови, позиціонуючи її як найвищезайняту модель США серед відкритих ваг за бенчмарками інтелекту. Реліз загострює конкуренцію у сегменті AI з відкритими вагами, де китайські моделі, зокрема Kimi K2.6 від Moonshot AI, нині очолюють глобальні рейтинги інтелекту попри переваги Nvidia в швидкості.
Artificial Analysis, яка співпрацювала з Nvidia під час оцінювання до релізу, відвела Nemotron 3 Ultra оцінку 48 на своєму Intelligence Index. Композитний бенчмарк агрегує 10 оцінювань, що охоплюють міркування, кодування, загальні знання та агентну продуктивність. Ця оцінка робить Nemotron 3 Ultra найкращою моделлю США з відкритими вагами, випереджаючи Gemma 4 31B від Google (39), власну Nemotron 3 Super від Nvidia (36) та gpt-oss-120b від OpenAI (33).
Модель використовує архітектуру mixture-of-experts із загальними 550 мільярдами параметрів, але активує лише 55 мільярдів у будь-який момент. Такий підхід знижує операційні витрати, зберігаючи продуктивність у складних задачах міркування.
Nemotron 3 Ultra на передрелізному endpoint DeepInfra генерувала понад 300 вихідних токенів за секунду, згідно з тестуванням Artificial Analysis. Китайські моделі в тому ж класі інтелекту — DeepSeek V4 Pro та Kimi K2.6 — нині працюють на рівні 50–100 токенів за секунду через їхні комерційні API. Nvidia стверджує, що модель працює у 5 разів швидше за зіставні альтернативи з відкритими вагами, при цьому її вартість на 30% нижча.
Архітектура поєднує Mamba-2 шари, стандартну увагу Transformer і маршрутизацію mixture-of-experts. Модель підтримує контекстне вікно на 1 мільйон токенів і використовує multi-token prediction (MTP), яка генерує одразу кілька майбутніх токенів, а не послідовно.
Kimi K2.6 від Moonshot AI займає перше місце серед моделей із відкритими вагами з оцінкою Intelligence Index 54 — на 6 пунктів більше, ніж Nemotron 3 Ultra. Релізнувшись у квітні, Kimi K2.6 посідає четверте місце глобально серед усіх AI-моделей, відстаючи на 3 пункти від власних флагманів Anthropic, Google та OpenAI, які мають однакові 57.
Китайські open-source моделі збільшили свою частку глобального використання open-моделей приблизно з 1,2% наприкінці 2024 року до близько 30% до кінця 2025 року, як повідомлялося в березні.
Nvidia випустила першу модель під брендом Nemotron у листопаді 2023 року, а третє покоління оголосила в грудні 2025 року. Сімейство включає три розміри: Nano для легших задач, Super для середньорівневих корпоративних застосунків і Ultra для складних workload’ів із міркуванням. Усі три моделі мають спільну гібридну архітектуру, що поєднує Mamba-2 шари, увагу Transformer і маршрутизацію mixture-of-experts.
Nemotron 3 Super, випущена в березні з 120 мільярдами параметрів, отримала 36 на Intelligence Index. Зростання Nemotron 3 Ultra на 12 пунктів є суттєвим прогресом у межах лінійки продуктів.
Nvidia розкрила п’ятирічний план витратити 26 мільярдів доларів на розробку AI з відкритими вагами. Компанія створила Nemotron Coalition у березні — групу з восьми AI-лабораторій, зокрема Mistral AI та Perplexity, щоб спільно розробляти моделі відкритого frontier на інфраструктурі DGX Cloud. Nvidia також оголосила, що працює над Nemotron 4 — наступним поколінням у сімействі моделей.
Nemotron 3 Ultra виходить 4 червня. Ваги моделі є публічними, а рецепти навчання будуть опубліковані. Користувачі можуть отримати доступ до моделі через API Nvidia або хмарних провайдерів без потреби в виділеному обладнанні дата-центру.
Який показник інтелекту досягла Nemotron 3 Ultra Nvidia 1 червня? Nemotron 3 Ultra набрала 48 на Intelligence Index від Artificial Analysis, ставши моделлю США з відкритими вагами найвищого рангу. Бенчмарк агрегує 10 оцінювань, що охоплюють міркування, кодування, загальні знання та агентну продуктивність.
Як швидкість Nemotron 3 Ultra порівнюється з китайськими моделями? Nemotron 3 Ultra видала понад 300 вихідних токенів за секунду на передрелізному endpoint DeepInfra, тоді як китайські моделі DeepSeek V4 Pro та Kimi K2.6 працюють на рівні 50–100 токенів за секунду через їхні комерційні API.
Коли Nemotron 3 Ultra від Nvidia стане доступною? Nemotron 3 Ultra виходить 4 червня. Користувачі зможуть отримати доступ до моделі через API Nvidia або хмарних провайдерів; публічні ваги та рецепти навчання будуть опубліковані.
Пов’язані новини
Alphabet прагне залучити 80 мільярдів доларів для фінансування розширення інфраструктури для ШІ
NVIDIA співпрацює з Unitree над референсним дизайном H2+ для гуманоїдного робота
Intel Спрямовує Атаку на Nvidia та AMD Новим AI-Чипом
NVIDIA запускає чип для ПК RTX Spark та процесор Vera на COMPUTEX 2026
OpenAI оголошує про запуск підрозділу робототехніки 1 червня