чіповий гігант NVIDIA сьогодні (4 числа) оголосив про запуск нової відкритої флагманської моделі «Nemotron 3 Ultra». Ця модель спеціально створена для довготривалих AI-агентів та складних багатьох агентських робочих потоків, має до 550 мільярдів загальних параметрів. Завдяки впровадженню гібридної архітектури та кількох інноваційних технологій, Nemotron 3 Ultra не лише демонструє відмінні результати у багатьох бенчмарках, але й забезпечує до 5-кратне зростання пропускної здатності та знижує вартість агентських завдань на 30%.
(Попередній огляд: Nvidia витрачає 400 мільйонів доларів на купівлю Kumo AI! Доповнює «пазл корпоративних прогнозних моделей», прискорюючи перетворення у повноцінного AI-гіганта)
(Додатковий фон: Nvidia уклала союз із китайською стартап-компанією Юйшуд科技 Unitree! 黃仁勳 просуває «платформу AI для гуманоїдних роботів», активно виходить на багатотрильйонний ринок фізичних AI)

Зміст статті

Перемикач

550 мільярдів активних параметрів, перетворюючись у «мозок» AI-робочих потоків
П’ять основних технологічних інновацій: зростання пропускної здатності у 5 разів, зниження витрат на 30%
Повністю відкритий код, прискорюючи впровадження корпоративних AI-застосунків

У тенденції розвитку штучного інтелекту (AI) у напрямку високої автоматизації та складних робочих потоків, обчислювальні витрати та вузькі місця системи «багатоагентних систем (Multi-agent systems)» стають найбільшими проблемами для компаній при впровадженні AI. Щоб вирішити цю проблему, NVIDIA 4 червня 2026 року офіційно представила флагманську лінійку продуктів Nemotron 3 — Nemotron 3 Ultra.

Це потужна відкрита модель, спеціально розроблена для «довготривалих AI-агентів». У традиційних багатьох агентських потоках через постійне повторне планування, виклики інструментів, делегування підагентів та підтримку довгого контексту, часто виникає значне споживання токенів (Token), що призводить до високих витрат і ризику відхилення від цілей. Саме для подолання цих викликів і створена Nemotron 3 Ultra.

550 мільярдів активних параметрів, перетворюючись у «мозок» AI-робочих потоків

Nemotron 3 Ultra використовує архітектуру змішаних експертів (Mixture-of-Experts, MoE), з загальним обсягом параметрів до 5500 мільярдів, але при кожному обчисленні активується лише 550 мільярдів активних параметрів, що забезпечує максимальну ефективність роботи. У багатьох агентських робочих потоках ця модель позиціонується як «координатор (Orchestrator)» або передовий інтелектуальний рушій, що спеціалізується на глибокому плануванні, складному аналізі та логічній перевірці високого навантаження, тоді як рутинні завдання та виклики інструментів делегуються легким моделям.

Щодо продуктивності, Nemotron 3 Ultra показує видатні результати у багатьох бенчмарках, орієнтованих на AI-агентів. Наприклад, у PinchBench він отримав 91% високих балів, у довгостроковому плануванні (EnterpriseOps-Gym) та програмуванні (Terminal-Bench 2.0) — 40% і 67% відповідно. Хоча кількість активних параметрів менша, його загальні можливості логічного виведення вже перевищують або дорівнюють популярним відкритим моделям, таким як GLM 5.1, Kimi K2.6 та Qwen3.5.

П’ять основних технологічних інновацій: зростання пропускної здатності у 5 разів, зниження витрат на 30%

Щоб досягти такої високої продуктивності та швидкості, NVIDIA впровадила п’ять ключових технологічних інновацій у Nemotron 3 Ultra. По-перше, «гібридний шар Mamba-Transformer», який майстерно поєднує ефективність обробки довгих послідовностей Mamba та точність відтворення фактів Transformer. По-друге, підтримка «NVFP4 квантовання», що дозволяє безшовно розгортати ваги моделі на GPU архітектур Hopper, Blackwell та Ampere, у порівнянні з традиційним форматом BF16, на Blackwell можна досягти до 5-кратного зростання пропускної здатності (швидкості виведення).

Крім того, модель інтегрує LatentMoE (ефективний маршрутизатор експертів для складних навантажень), багатократне прогнозування токенів (MTP, передбачає кілька майбутніх токенів за один прохід для швидшого генерування довгих текстів), а також багатьох учителів онлайн-дистиляції (MOPD) та інші передові технології. Ці інновації суттєво зменшують загальне споживання токенів під час виконання завдань, що дозволяє знизити вартість агентських задач для компаній до 30%.

Повністю відкритий код, прискорюючи впровадження корпоративних AI-застосунків

Щодо даних для тренування, Nemotron 3 Ultra базується на понад 10 трильйонах токенів у масштабній попередній обробці, а також додатково включає понад 212 мільярдів доменних токенів (зокрема, юридичні документи, тексти у стилі Вікіпедії та найновіший код з GitHub). NVIDIA підкреслює, що ця модель є повністю відкритою, з ліцензією OpenMDW-1.1, що дуже гнучка, і відкриває для спільноти повний набір ваг, формули тренування та канали даних.

Зараз розробники можуть отримати та розгортати Nemotron 3 Ultra на основних платформах, таких як Hugging Face, NVIDIA Build та NIM. Завдяки своїм видатним можливостям обробки довгих текстів (до 95% у тесті Ruler @1M) та високій економічності, ця модель, ймовірно, стане незамінним інструментом для компаній у автоматизації обслуговування клієнтів, управлінні ланцюгами поставок, IT-безпеці та верифікації чіпів.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
ShareYourUSStocksWinNvidia
3.43M Популярність
#
PredictNBAChampionWin20000U
2.16M Популярність
#
IsraelStrikesIranBTCPlunges
53.97K Популярність
#
BitcoinETFSees7272BTCOutflow
657.21M Популярність
#
SpaceXRoadshowHighlightsAsteroidMining
1.36M Популярність

Закріплено

карта сайту

Nvidia випустила найпотужнішу відкриту модель Nemotron 3 Ultra! Зосереджена на AI-агентських завданнях, продуктивність зросла в 5 разів, а витрати зменшилися на 30%

550 мільярдів активних параметрів, перетворюючись у «мозок» AI-робочих потоків

П’ять основних технологічних інновацій: зростання пропускної здатності у 5 разів, зниження витрат на 30%

Повністю відкритий код, прискорюючи впровадження корпоративних AI-застосунків

Популярні теми

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Закріплено