NVIDIA випустила у США найпотужніший відкритий AI; індекс інтелекту 48 відстає від моделі Kimi

輝達開源AI

Генеральний директор NVIDIA Хуанджень Сюнь 1 червня під час основної доповіді на виставці Computex у Тайбеї представив Nemotron 3 Ultra — відкриту модель із вагами, яка в попередніх спільних оцінюваннях Artificial Analysis і NVIDIA отримала індекс розумності 48 балів, але поступилася китайській Moonshot AI з Kimi K2.6 — 54 бали.

Технічні характеристики Nemotron 3 Ultra: 55 мільярдів активних параметрів, контекстне вікно на мільйон токенів і відвантаження 4 червня

Nemotron 3 Ultra використовує архітектуру змішаних експертів (MoE): загальна кількість параметрів — 5,500 мільярда, а в кожен момент активуються лише 550 мільярда активних параметрів; поєднання шарів Mamba-2, стандартного механізму уваги Transformer і маршрутизації між змішаними експертами. Модель підтримує контекстне вікно на 1 мільйон token і використовує технологію передбачення багатьох токенів (MTP) для пришвидшення генерації.

NVIDIA заявляє, що порівняно з іншими відкритими моделями з вагами такого класу швидкість виведення (inference) Ultra вища в 5 разів, а вартість — на 30% нижча. На попередньо запущених кінцевих точках DeepInfra модель може обробляти понад 300 вихідних token на секунду; натомість DeepSeek V4 Pro і Kimi K2.6 через комерційні API обробляють лише 50–100 token на секунду. Ваги моделі оприлюднено, навчальні схеми вже опубліковані, а офіційна дата відвантаження — 4 червня 2026 року.

Пряме зіставлення індексу розумності open-source AI у США та Китаї: дані Artificial Analysis

Згідно з опублікованими Artificial Analysis даними оцінювання, топ-розподіл індексу розумності основних моделей такий: глобальні закриті флагмани (Anthropic, Google, OpenAI) — усі по 57 балів; Kimi K2.6 (Moonshot AI, Китай, випуск у квітні 2026 року) — 54 бали, четверте місце у світі; Nemotron 3 Ultra (NVIDIA, США) — 48 балів, перше місце серед open-source у США; Google Gemma 4 31B (США) — 39 балів; Nemotron 3 Super (NVIDIA, березень 2026 року, 120B параметрів) — 36 балів; OpenAI gpt-oss-120b (США) — 33 бали. Індекс розумності є зведеним критерієм із 10 пунктів оцінювання (inference, кодування, загальні знання, продуктивність агентів): чим вищий бал, тим сильніша модель.

Союз Nemotron і Nemotron 4: підтверджена рамка наступної генерації розробки

NVIDIA паралельно оголосила на Computex, що Nemotron 4 уже в розробці: за нього відповідає Nemotron союз, зібраний NVIDIA у березні 2026 року. До складу входять 8 AI лабораторій, зокрема Mistral AI та Perplexity, які спільно розробляють модель на основі хмарної інфраструктури DGX.

Раніше NVIDIA вже публічно оголосила п’ятирічний план інвестицій в open-source AI на 26 мільярда доларів; Nemotron 3 Ultra є наразі найбільш репрезентативним результатом. Частка глобального використання відкритих моделей Китаю зросла з приблизно 1,2% наприкінці 2024 року до приблизно 30% наприкінці 2025 року (джерело: Decrypt, повідомлення від березня 2026 року).

Поширені запитання

Чим Nemotron 3 Ultra кращий за попередню версію Nemotron 3 Super?

Nemotron 3 Super вийшов у березні 2026 року, має 120 мільярда параметрів і індекс розумності 36 балів; індекс розумності Nemotron 3 Ultra — 48 балів, тобто підвищення на 12 балів рік до року. NVIDIA зазначає, що підвищення на 12 балів у межах бенчмарків є помітним стрибком.

Чому індекс розумності Kimi K2.6 вищий, ніж у NVIDIA Nemotron 3 Ultra?

Індекс розумності Kimi K2.6 від китайської Moonshot AI — 54 бали, тоді як Nemotron 3 Ultra — 48 балів; різниця становить 6 балів. У світовому рейтингу всіх моделей (включно із закритими) Kimi K2.6 посідає четверте місце, поступаючись лише флагманам закритого типу Anthropic, Google та OpenAI (по 57 балів), тобто відставання — на 3 бали. Американські OpenAI, Anthropic і Google тяжіють до того, щоб утримувати найсильніші моделі позаду API, а китайські лабораторії натомість продовжують вносити у відкриту екосистему високобальні моделі.

У яких сценаріях швидкісна перевага Nemotron 3 Ultra є найбільш критичною?

Ultra обробляє понад 300 вихідних token на секунду, що у 3–6 разів швидше, ніж комерційні API DeepSeek V4 Pro та Kimi K2.6. NVIDIA підкреслює, що ця перевага особливо важлива під час тривалого виконання багатокрокових завдань автономними AI-агентами, адже очікування на кожному кроці швидко накопичується в складних сценаріях.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів