NVIDIA випустила у США найпотужніший відкритий AI; індекс інтелекту 48 відстає від моделі Kimi

2026-06-02 03:28:58

Генеральний директор NVIDIA Хуанджень Сюнь 1 червня під час основної доповіді на виставці Computex у Тайбеї представив Nemotron 3 Ultra — відкриту модель із вагами, яка в попередніх спільних оцінюваннях Artificial Analysis і NVIDIA отримала індекс розумності 48 балів, але поступилася китайській Moonshot AI з Kimi K2.6 — 54 бали.

Технічні характеристики Nemotron 3 Ultra: 55 мільярдів активних параметрів, контекстне вікно на мільйон токенів і відвантаження 4 червня

Nemotron 3 Ultra використовує архітектуру змішаних експертів (MoE): загальна кількість параметрів — 5,500 мільярда, а в кожен момент активуються лише 550 мільярда активних параметрів; поєднання шарів Mamba-2, стандартного механізму уваги Transformer і маршрутизації між змішаними експертами. Модель підтримує контекстне вікно на 1 мільйон token і використовує технологію передбачення багатьох токенів (MTP) для пришвидшення генерації.

NVIDIA заявляє, що порівняно з іншими відкритими моделями з вагами такого класу швидкість виведення (inference) Ultra вища в 5 разів, а вартість — на 30% нижча. На попередньо запущених кінцевих точках DeepInfra модель може обробляти понад 300 вихідних token на секунду; натомість DeepSeek V4 Pro і Kimi K2.6 через комерційні API обробляють лише 50–100 token на секунду. Ваги моделі оприлюднено, навчальні схеми вже опубліковані, а офіційна дата відвантаження — 4 червня 2026 року.

Пряме зіставлення індексу розумності open-source AI у США та Китаї: дані Artificial Analysis

Згідно з опублікованими Artificial Analysis даними оцінювання, топ-розподіл індексу розумності основних моделей такий: глобальні закриті флагмани (Anthropic, Google, OpenAI) — усі по 57 балів; Kimi K2.6 (Moonshot AI, Китай, випуск у квітні 2026 року) — 54 бали, четверте місце у світі; Nemotron 3 Ultra (NVIDIA, США) — 48 балів, перше місце серед open-source у США; Google Gemma 4 31B (США) — 39 балів; Nemotron 3 Super (NVIDIA, березень 2026 року, 120B параметрів) — 36 балів; OpenAI gpt-oss-120b (США) — 33 бали. Індекс розумності є зведеним критерієм із 10 пунктів оцінювання (inference, кодування, загальні знання, продуктивність агентів): чим вищий бал, тим сильніша модель.

Союз Nemotron і Nemotron 4: підтверджена рамка наступної генерації розробки

NVIDIA паралельно оголосила на Computex, що Nemotron 4 уже в розробці: за нього відповідає Nemotron союз, зібраний NVIDIA у березні 2026 року. До складу входять 8 AI лабораторій, зокрема Mistral AI та Perplexity, які спільно розробляють модель на основі хмарної інфраструктури DGX.

Раніше NVIDIA вже публічно оголосила п’ятирічний план інвестицій в open-source AI на 26 мільярда доларів; Nemotron 3 Ultra є наразі найбільш репрезентативним результатом. Частка глобального використання відкритих моделей Китаю зросла з приблизно 1,2% наприкінці 2024 року до приблизно 30% наприкінці 2025 року (джерело: Decrypt, повідомлення від березня 2026 року).

Поширені запитання

Чим Nemotron 3 Ultra кращий за попередню версію Nemotron 3 Super?

Nemotron 3 Super вийшов у березні 2026 року, має 120 мільярда параметрів і індекс розумності 36 балів; індекс розумності Nemotron 3 Ultra — 48 балів, тобто підвищення на 12 балів рік до року. NVIDIA зазначає, що підвищення на 12 балів у межах бенчмарків є помітним стрибком.

Чому індекс розумності Kimi K2.6 вищий, ніж у NVIDIA Nemotron 3 Ultra?

Індекс розумності Kimi K2.6 від китайської Moonshot AI — 54 бали, тоді як Nemotron 3 Ultra — 48 балів; різниця становить 6 балів. У світовому рейтингу всіх моделей (включно із закритими) Kimi K2.6 посідає четверте місце, поступаючись лише флагманам закритого типу Anthropic, Google та OpenAI (по 57 балів), тобто відставання — на 3 бали. Американські OpenAI, Anthropic і Google тяжіють до того, щоб утримувати найсильніші моделі позаду API, а китайські лабораторії натомість продовжують вносити у відкриту екосистему високобальні моделі.

У яких сценаріях швидкісна перевага Nemotron 3 Ultra є найбільш критичною?

Ultra обробляє понад 300 вихідних token на секунду, що у 3–6 разів швидше, ніж комерційні API DeepSeek V4 Pro та Kimi K2.6. NVIDIA підкреслює, що ця перевага особливо важлива під час тривалого виконання багатокрокових завдань автономними AI-агентами, адже очікування на кожному кроці швидко накопичується в складних сценаріях.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

6год тому

ЦП Vera від Nvidia на 88 ядер буде використаний Anthropic, OpenAI та SpaceX; повноцінне виробництво заплановане на 3 квартал

7год тому

MiniMax представляє модель M3 для кодування з місткістю 100 млн токенів і в 5 разів швидшою обробкою 1 червня

8год тому

Nvidia представляє Nemotron 3 Ultra, провідну відкриту модель США, але вона посідає нижче місце за китайську Kimi K2.6

Пов'язані статті

Деталі бренду Qualcomm Dragonfly перенесли на 24 червня, ціна акцій до відкриття ринку впала більш ніж на 8%

Market Whisper4год тому

Хуанг Женьхун спростовує тезу про безробіття через ШІ, Сон Масайосі: нинішні масштаби — це мережевий бульбашковий ринок у 50 разів

Market Whisper5год тому