Ф'ючерси
Сотні безстрокових контрактів
CFD
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Pre-IPOs
Отримайте повний доступ до глобальних IPO акцій.
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Акції
Центр діяльності
Беріть учать та отримуйте винагороди
Реферал
20 USDT
Запрошуйте друзів та отримуйте бонуси
Партнерська програма
Ексклюзивні комісійні винагороди
Gate Booster
Зростайте та отримуйте аірдропи
Оголошення
Оновлення платформи в реальному часі
Блог Gate
Статті про криптоіндустрію
VIP послуги
Величезні знижки на комісії
Управління активами
Універсальне рішення для управління активами
Інституційний
Рішення цифрових активів для бізнесу
Розробники (API)
Підключається до екосистеми додатків Gate
Позабіржовий банківський переказ
Поповнюйте та виводьте фіат
Брокерська програма
Щедрі механізми знижок API
AI
Gate AI
Ваш універсальний AI-помічник для спілкування
Gate AI Bot
Використовуйте Gate AI безпосередньо у своєму соціальному додатку
GateClaw
Gate Блакитний Лобстер — готовий до використання
Gate for AI Agent
AI-інфраструктура, Gate MCP, Skills і CLI
Gate Skills Hub
Понад 10 000 навичок
Від офісу до трейдингу: універсальна база навичок для ефективнішої роботи з AI
GateRouter
Розумний вибір із понад 40 моделей ШІ, без додаткових витрат (0%)
Nvidia випустила найпотужнішу відкриту модель Nemotron 3 Ultra! Зосереджена на AI-агентських завданнях, продуктивність зросла в 5 разів, а витрати зменшилися на 30%
чіповий гігант NVIDIA сьогодні (4 числа) оголосив про запуск нової відкритої флагманської моделі «Nemotron 3 Ultra». Ця модель спеціально створена для довготривалих AI-агентів та складних багатьох агентських робочих потоків, має до 550 мільярдів загальних параметрів. Завдяки впровадженню гібридної архітектури та кількох інноваційних технологій, Nemotron 3 Ultra не лише демонструє відмінні результати у багатьох бенчмарках, але й забезпечує до 5-кратне зростання пропускної здатності та знижує вартість агентських завдань на 30%.
(Попередній огляд: Nvidia витрачає 400 мільйонів доларів на купівлю Kumo AI! Доповнює «пазл корпоративних прогнозних моделей», прискорюючи перетворення у повноцінного AI-гіганта)
(Додатковий фон: Nvidia уклала союз із китайською стартап-компанією Юйшуд科技 Unitree! 黃仁勳 просуває «платформу AI для гуманоїдних роботів», активно виходить на багатотрильйонний ринок фізичних AI)
Зміст статті
Перемикач
У тенденції розвитку штучного інтелекту (AI) у напрямку високої автоматизації та складних робочих потоків, обчислювальні витрати та вузькі місця системи «багатоагентних систем (Multi-agent systems)» стають найбільшими проблемами для компаній при впровадженні AI. Щоб вирішити цю проблему, NVIDIA 4 червня 2026 року офіційно представила флагманську лінійку продуктів Nemotron 3 — Nemotron 3 Ultra.
Це потужна відкрита модель, спеціально розроблена для «довготривалих AI-агентів». У традиційних багатьох агентських потоках через постійне повторне планування, виклики інструментів, делегування підагентів та підтримку довгого контексту, часто виникає значне споживання токенів (Token), що призводить до високих витрат і ризику відхилення від цілей. Саме для подолання цих викликів і створена Nemotron 3 Ultra.
550 мільярдів активних параметрів, перетворюючись у «мозок» AI-робочих потоків
Nemotron 3 Ultra використовує архітектуру змішаних експертів (Mixture-of-Experts, MoE), з загальним обсягом параметрів до 5500 мільярдів, але при кожному обчисленні активується лише 550 мільярдів активних параметрів, що забезпечує максимальну ефективність роботи. У багатьох агентських робочих потоках ця модель позиціонується як «координатор (Orchestrator)» або передовий інтелектуальний рушій, що спеціалізується на глибокому плануванні, складному аналізі та логічній перевірці високого навантаження, тоді як рутинні завдання та виклики інструментів делегуються легким моделям.
Щодо продуктивності, Nemotron 3 Ultra показує видатні результати у багатьох бенчмарках, орієнтованих на AI-агентів. Наприклад, у PinchBench він отримав 91% високих балів, у довгостроковому плануванні (EnterpriseOps-Gym) та програмуванні (Terminal-Bench 2.0) — 40% і 67% відповідно. Хоча кількість активних параметрів менша, його загальні можливості логічного виведення вже перевищують або дорівнюють популярним відкритим моделям, таким як GLM 5.1, Kimi K2.6 та Qwen3.5.
П’ять основних технологічних інновацій: зростання пропускної здатності у 5 разів, зниження витрат на 30%
Щоб досягти такої високої продуктивності та швидкості, NVIDIA впровадила п’ять ключових технологічних інновацій у Nemotron 3 Ultra. По-перше, «гібридний шар Mamba-Transformer», який майстерно поєднує ефективність обробки довгих послідовностей Mamba та точність відтворення фактів Transformer. По-друге, підтримка «NVFP4 квантовання», що дозволяє безшовно розгортати ваги моделі на GPU архітектур Hopper, Blackwell та Ampere, у порівнянні з традиційним форматом BF16, на Blackwell можна досягти до 5-кратного зростання пропускної здатності (швидкості виведення).
Крім того, модель інтегрує LatentMoE (ефективний маршрутизатор експертів для складних навантажень), багатократне прогнозування токенів (MTP, передбачає кілька майбутніх токенів за один прохід для швидшого генерування довгих текстів), а також багатьох учителів онлайн-дистиляції (MOPD) та інші передові технології. Ці інновації суттєво зменшують загальне споживання токенів під час виконання завдань, що дозволяє знизити вартість агентських задач для компаній до 30%.
Повністю відкритий код, прискорюючи впровадження корпоративних AI-застосунків
Щодо даних для тренування, Nemotron 3 Ultra базується на понад 10 трильйонах токенів у масштабній попередній обробці, а також додатково включає понад 212 мільярдів доменних токенів (зокрема, юридичні документи, тексти у стилі Вікіпедії та найновіший код з GitHub). NVIDIA підкреслює, що ця модель є повністю відкритою, з ліцензією OpenMDW-1.1, що дуже гнучка, і відкриває для спільноти повний набір ваг, формули тренування та канали даних.
Зараз розробники можуть отримати та розгортати Nemotron 3 Ultra на основних платформах, таких як Hugging Face, NVIDIA Build та NIM. Завдяки своїм видатним можливостям обробки довгих текстів (до 95% у тесті Ruler @1M) та високій економічності, ця модель, ймовірно, стане незамінним інструментом для компаній у автоматизації обслуговування клієнтів, управлінні ланцюгами поставок, IT-безпеці та верифікації чіпів.