Nvidia представляє Nemotron 3 Ultra на Computex, випереджаючи Kimi K2.6 від Китаю в рейтингах інтелектуальності

Nvidia представила Nemotron 3 Ultra 1 червня на Computex у Тайбеї — відкриту модель із 550 мільярдами параметрів із відкритими вагами, що є найбільшим релізом відкритого AI компанії на сьогодні. CEO Дженсен Хуанг оголосив модель під час свого keynote-промови, позиціонуючи її як найвищезайняту модель США серед відкритих ваг за бенчмарками інтелекту. Реліз загострює конкуренцію у сегменті AI з відкритими вагами, де китайські моделі, зокрема Kimi K2.6 від Moonshot AI, нині очолюють глобальні рейтинги інтелекту попри переваги Nvidia в швидкості.

Nemotron 3 Ultra набирає 48 на бенчмарку Intelligence Index

Artificial Analysis, яка співпрацювала з Nvidia під час оцінювання до релізу, відвела Nemotron 3 Ultra оцінку 48 на своєму Intelligence Index. Композитний бенчмарк агрегує 10 оцінювань, що охоплюють міркування, кодування, загальні знання та агентну продуктивність. Ця оцінка робить Nemotron 3 Ultra найкращою моделлю США з відкритими вагами, випереджаючи Gemma 4 31B від Google (39), власну Nemotron 3 Super від Nvidia (36) та gpt-oss-120b від OpenAI (33).

Модель використовує архітектуру mixture-of-experts із загальними 550 мільярдами параметрів, але активує лише 55 мільярдів у будь-який момент. Такий підхід знижує операційні витрати, зберігаючи продуктивність у складних задачах міркування.

Модель видає 300+ токенів за секунду на endpoint перед релізом

Nemotron 3 Ultra на передрелізному endpoint DeepInfra генерувала понад 300 вихідних токенів за секунду, згідно з тестуванням Artificial Analysis. Китайські моделі в тому ж класі інтелекту — DeepSeek V4 Pro та Kimi K2.6 — нині працюють на рівні 50–100 токенів за секунду через їхні комерційні API. Nvidia стверджує, що модель працює у 5 разів швидше за зіставні альтернативи з відкритими вагами, при цьому її вартість на 30% нижча.

Архітектура поєднує Mamba-2 шари, стандартну увагу Transformer і маршрутизацію mixture-of-experts. Модель підтримує контекстне вікно на 1 мільйон токенів і використовує multi-token prediction (MTP), яка генерує одразу кілька майбутніх токенів, а не послідовно.

Kimi K2.6 очолює рейтинги відкритих ваг із 54-бальною оцінкою інтелекту

Kimi K2.6 від Moonshot AI займає перше місце серед моделей із відкритими вагами з оцінкою Intelligence Index 54 — на 6 пунктів більше, ніж Nemotron 3 Ultra. Релізнувшись у квітні, Kimi K2.6 посідає четверте місце глобально серед усіх AI-моделей, відстаючи на 3 пункти від власних флагманів Anthropic, Google та OpenAI, які мають однакові 57.

Китайські open-source моделі збільшили свою частку глобального використання open-моделей приблизно з 1,2% наприкінці 2024 року до близько 30% до кінця 2025 року, як повідомлялося в березні.

Сімейство Nemotron охоплює три розміри моделей з 2023 року

Nvidia випустила першу модель під брендом Nemotron у листопаді 2023 року, а третє покоління оголосила в грудні 2025 року. Сімейство включає три розміри: Nano для легших задач, Super для середньорівневих корпоративних застосунків і Ultra для складних workload’ів із міркуванням. Усі три моделі мають спільну гібридну архітектуру, що поєднує Mamba-2 шари, увагу Transformer і маршрутизацію mixture-of-experts.

Nemotron 3 Super, випущена в березні з 120 мільярдами параметрів, отримала 36 на Intelligence Index. Зростання Nemotron 3 Ultra на 12 пунктів є суттєвим прогресом у межах лінійки продуктів.

Nvidia виділяє 26 мільярдів доларів на розробку AI з відкритими вагами

Nvidia розкрила п’ятирічний план витратити 26 мільярдів доларів на розробку AI з відкритими вагами. Компанія створила Nemotron Coalition у березні — групу з восьми AI-лабораторій, зокрема Mistral AI та Perplexity, щоб спільно розробляти моделі відкритого frontier на інфраструктурі DGX Cloud. Nvidia також оголосила, що працює над Nemotron 4 — наступним поколінням у сімействі моделей.

Реліз 4 червня через API Nvidia та хмарних провайдерів

Nemotron 3 Ultra виходить 4 червня. Ваги моделі є публічними, а рецепти навчання будуть опубліковані. Користувачі можуть отримати доступ до моделі через API Nvidia або хмарних провайдерів без потреби в виділеному обладнанні дата-центру.

FAQ

Який показник інтелекту досягла Nemotron 3 Ultra Nvidia 1 червня? Nemotron 3 Ultra набрала 48 на Intelligence Index від Artificial Analysis, ставши моделлю США з відкритими вагами найвищого рангу. Бенчмарк агрегує 10 оцінювань, що охоплюють міркування, кодування, загальні знання та агентну продуктивність.

Як швидкість Nemotron 3 Ultra порівнюється з китайськими моделями? Nemotron 3 Ultra видала понад 300 вихідних токенів за секунду на передрелізному endpoint DeepInfra, тоді як китайські моделі DeepSeek V4 Pro та Kimi K2.6 працюють на рівні 50–100 токенів за секунду через їхні комерційні API.

Коли Nemotron 3 Ultra від Nvidia стане доступною? Nemotron 3 Ultra виходить 4 червня. Користувачі зможуть отримати доступ до моделі через API Nvidia або хмарних провайдерів; публічні ваги та рецепти навчання будуть опубліковані.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів