Intel та Nvidia загострюють конкуренцію у сфері AI-інференції: чи зможе Crescent Island Xe3P змінити структуру дата-цент

Markets
Оновлено: 03/06/2026 09:08

У міру того як індустрія штучного інтелекту зміщує фокус із навчання моделей на масштабний інференс, структура витрат на обчислювальні ресурси зазнає фундаментальних змін. У червні 2026 року компанія Intel представила на виставці Computex 2026 свій новий прискорювач інференсу для дата-центрів — "Crescent Island". Цей пристрій побудовано на архітектурі Xe3P і оснащено пам’яттю LPDDR5X. Таке рішення демонструє чіткий стратегічний зсув для традиційного виробника чипів у сфері інфраструктури ШІ. Замість прямої конкуренції з Nvidia на ринку навчання моделей Intel обирає сегмент інференсу, роблячи ставку на іншу ціннісну пропозицію: "низька вартість, достатня продуктивність".

Огляд архітектури продукту: технічна логіка Xe3P і LPDDR5X

Найбільш помітна особливість Crescent Island — це архітектура пам’яті. На відміну від більшості сучасних прискорювачів для навчання ШІ, які використовують пам’ять із високою пропускною здатністю, Intel обрала LPDDR5X — зрілу, енергоефективну технологію пам’яті, що широко застосовується в мобільних пристроях і масовій споживчій електроніці.

Щодо технічних характеристик: референсний дизайн містить 160 ГБ пам’яті LPDDR5X із можливістю розширення до 480 ГБ через партнерські проєкти з виробниками оригінального дизайну (ODM). Споживання електроенергії становить 350 Вт, використовується повітряне охолодження, підтримується повний спектр типів даних — від FP4/MXFP4 до FP64. За розрахунками TechTimes, враховуючи 640-бітний інтерфейс пам’яті та LPDDR5X із пропускною здатністю 10,7 Гбіт/с, пропускна здатність становить приблизно 684 ГБ/с. Для порівняння, у Nvidia H200 із HBM3e цей показник сягає близько 4,8 ТБ/с. Такий розрив у пропускній здатності суттєвий для навчальних навантажень, але для масштабних, висококонкурентних інференс-завдань із великими мовними моделями гранична користь від пропускної здатності нижча, ніж гранична цінність енергоефективності та вартості. Intel наголошує, що цей чип "створено для Agentic AI", а основний показник ефективності — "Token/Watt", тобто максимальна кількість оброблених інференс-запитів на одиницю енергії.

Щодо сумісності впровадження, низький енергоспоживчий профіль LPDDR5X дозволяє використовувати рішення на 350 Вт із повітряним охолодженням. Це означає, що Crescent Island не потребує спеціальної інфраструктури рідинного охолодження й може інтегруватися безпосередньо у стандартні стійки та існуючі середовища дата-центрів, знижуючи витрати на адаптацію після придбання.

Ринковий контекст: розширення та структурна диференціація ринку інференсу ШІ

Щоб зрозуміти стратегічне позиціонування Crescent Island, важливо спершу оцінити масштаб і логіку зростання сучасного ринку інференсу ШІ.

Визначень ринку інференсу ШІ існує декілька, тому важливо розмежовувати їх. У вузькому сенсі — ринок чипів для інференсу ШІ (лише апаратні ІС, без урахування програмного забезпечення та супутніх сервісів) — прогнозується зростання з приблизно 17,73 млрд доларів США у 2025 році до 20,51 млрд у 2026 році із середньорічним темпом (CAGR) близько 15,6%. У ширшому визначенні — ринок інференсу ШІ (включаючи апаратне забезпечення, програмне забезпечення та платформні сервіси) — у 2025 році обсяг становив близько 103,73 млрд доларів США, а у 2026 році очікується 117,8 млрд із CAGR приблизно 12,98%. Останній показник відображає загальний масштаб інвестицій в інфраструктуру й саме тут конкурують постачальники дата-центрів (CPU, GPU, мережі, пам’ять, програмний стек).

Структурно інференс-навантаження швидко збільшують свою частку в загальних обчисленнях ШІ. Експерти платформи Nebius нещодавно зазначили, що інференс наразі становить 90–95% корпоративного попиту на ШІ. Все більше компаній покладаються на попередньо навчені моделі або API-сервіси замість самостійного навчання базових моделей. Як наслідок, цінність інфраструктури ШІ зміщується з "максимізації продуктивності навчання" до "оптимізації вартості інференсу". Вищі темпи зростання інференс-навантажень порівняно з навчанням і є логічною основою для виходу Crescent Island на ринок.

Позиції Nvidia у навчанні ШІ залишаються непохитними. За даними галузевих аналітиків, загальна частка Nvidia на ринку прискорювачів ШІ (разом навчання й інференс) перевищує 70%, а в сегменті високопродуктивного навчання наближається до монопольних 98%. Проте така структура містить ризик: із переходом інференсу в мейнстрім "монопольна премія" за навчання — наразі найприбутковіша частина доходу Nvidia — буде розмита, поступившись місцем ширшому, але менш маржинальному ринку інференсу. Саме цю трансформацію прагне використати Crescent Island.

Порівняльний аналіз: різні структури витрат Intel і Nvidia

Конкуренція між продуктами Crescent Island та Nvidia — це по суті зіткнення двох принципово різних кривих витрат для виконання одних і тих самих завдань.

За даними розбору від Silicon Analysts, загальна собівартість виробництва Nvidia H100 становить близько 3 320 доларів США (логічний кристал ~300 доларів, HBM3 ~1 350, упаковка CoWoS-S ~750, тестування/збірка ~920). H200 із розширеною пам’яттю HBM до 141 ГБ підвищує собівартість до близько 4 800 доларів. B200 використовує двокристальну архітектуру, що знижує вартість логічного кристалу, але підвищує витрати на пам’ять і упаковку — загалом близько 6 400 доларів. Частка HBM у загальній структурі витрат зросла з приблизно 14% для A100 до 43% у H200, ставши основним чинником вартості.

Щодо оренди, ціна H100 на вимогу становить близько 2,95 долара за годину, H200 — 3,50, а B200 — від 4,90 до 6,50 за годину. За контрактами на 1–2 роки та мінімальній закупівлі від 10 000 одиниць ціни значно знижуються: H100 — до ~1,50, H200 — до ~2,20, B200 — до ~3,50 за годину. Важливо, що після травня 2026 року ціни оренди H200 зросли: на платформі Nebius із 1 червня 2026 року H200 подорожчав із 1,45 до 2,45 долара за годину, що ще більше підвищило операційні витрати на інференс.

Ціни на Crescent Island ще не оголошені, але собівартість LPDDR5X у розрахунку на одиницю ємності значно нижча, ніж у HBM, енергоспоживання 350 Вт знижує витрати на електроенергію й охолодження, а повітряне охолодження спрощує інфраструктуру дата-центрів. Це створює теоретичне підґрунтя для того, щоб загальна вартість володіння Crescent Island була суттєво нижчою за аналогічні продукти Nvidia. Керівник підрозділу дата-центрів Intel Кеворк Кечічян у коментарі Financial Times зазначив, що Crescent Island оминатиме домінування Nvidia у навчанні, фокусуючись на інференс-завданнях для обробки користувацьких запитів, а основна мета — зниження витрат на апаратне забезпечення та охолодження для клієнтів ШІ.

Щодо постачання, Intel планує надати зразки клієнтам у другій половині 2026 року й розпочати обмежені поставки до кінця року. Масштабна перевірка впровадження, ймовірно, завершиться на початку 2027 року.

Стратегічна перспектива: дефіцит пропозиції в інференсі та позиціонування Intel

Структурна суперечність сучасного ринку інференсу полягає в тому, що GPU, спроєктовані для навчання, мають надлишкову пропускну здатність і обчислювальні ресурси, які часто простоюють у сценаріях інференсу. Підприємства, які купують високопродуктивні GPU для пікових навантажень інференсу, постійно стикаються з "надмірним резервуванням" капіталу під час звичайної експлуатації. Crescent Island позиціонується саме на цьому перетині — пропонуючи "достатній інференс" замість "надлишкового навчання", що дозволяє знизити як початкові, так і поточні витрати.

Такий підхід логічно подібний до стратегії нових гравців, орієнтованих на інференс, наприклад, Groq. Однак Intel має ширші можливості інтеграції на рівні систем. На Computex 2026 компанія також презентувала rack-scale рішення для інфраструктури ШІ, будуючи гетерогенні архітектури інференсу на базі процесорів Xeon 6+ і RDU (Reconfigurable Dataflow Unit) від SambaNova, що охоплює весь ланцюг обчислень — від чипа до стійки. Основна конкурентна логіка полягає в тому, що зі зміщенням вузьких місць у навантаженнях ШІ з чистих обчислень на переміщення даних, оркестрацію завдань і координацію систем, роль CPU як універсального контрольного рівня лише зростає — і саме тут у Intel є значні інфраструктурні резерви.

Щодо програмної екосистеми, CUDA від Nvidia за понад 20 років здобула виняткову лояльність розробників: понад 5 мільйонів девелоперів створюють застосунки ШІ, а понад 90% навчальних завдань виконуються на CUDA. У свою чергу, Intel розвиває єдину програмну платформу oneAPI, яка у версії 2026.0 об’єднала Base Toolkit і HPC Toolkit в один пакет, забезпечуючи уніфіковану модель програмування для CPU, GPU, FPGA та прискорювачів, оптимізовану для новітніх процесорів Xeon і Arc GPU для навчання й інференсу. Проте міграція з CUDA на oneAPI залишається витратною: поточні інструменти автоматичної конвертації CUDA-to-DPC++ дозволяють перенести близько 90–95% коду, але решту доводиться переписувати й оптимізувати вручну. Ця "вартість тертя" суттєво впливатиме на темпи й широту впровадження Crescent Island у сценаріях інференсу.

Ризики й змінні

Ключові ризики, які варто враховувати:

По-перше, дані про продуктивність не розкрито. Станом на презентацію на Computex у червні 2026 року Intel не надала конкретних обчислювальних показників для Crescent Island. Розрив між фактичною продуктивністю й очікуваннями ринку стане вирішальним чинником для прийняття рішення.

По-друге, волатильність ланцюга постачання HBM. Вибір LPDDR5X у Intel базується на припущенні, що дефіцит HBM збережеться на роки. Очікується, що ціни на HBM3e зростуть на 15–20% у найближчі квартали, місткість упаковки CoWoS залишатиметься недостатньою на 40–50%, а терміни виконання замовлень сягатимуть 40–52 тижнів. Якщо ланцюг постачання HBM суттєво покращиться у 2027–2028 роках, премія за HBM-продукти зменшиться, а гранична перевага LPDDR5X щодо вартості знизиться.

По-третє, вартість міграції екосистеми. Екосистема CUDA є бар’єром для конкуренції не лише з технічної точки зору. Для великих підприємств із масштабною базою навчального й інференс-коду витрати на міграцію — це не лише технічні питання, а й організаційна інерція, кадровий резерв і оцінка ризиків. Такий нетехнічний бар’єр іноді складніше подолати, ніж суто технічні характеристики.

По-четверте, макроцикли попиту. Успіх Crescent Island зрештою залежить від впровадження гіпермасштабними операторами дата-центрів. Станом на червень 2026 року валідація розгортання у клієнтів Intel перебуває на ранній стадії. Чип Maia 2 для ШІ від Microsoft використовує техпроцес Intel 18A, але Maia 2 — це спеціалізований інференс-ASIC, відмінний за позиціонуванням від Crescent Island. Google Cloud і AWS мають глибоку співпрацю з процесорами Intel Xeon на рівні CPU, але чи використовуватимуть вони Crescent Island для прискорення інференсу ШІ — поки що невідомо.

Висновок: перевіряний виклик доступного інференсу

Технічна логіка Crescent Island має чітке підґрунтя для виходу на ринок: інференс-навантаження стрімко зростають, дефіцит HBM зберігається, а гранична вартість розширення дата-центрів постійно підвищується. Проте правильний напрям не гарантує результату.

Ринку потрібна не теоретична аргументація "чому Crescent Island може бути успішним", а перевірені дані — зокрема опубліковані показники TOPS або TFLOPS, конкретні значення Token/Watt і реальні відгуки клієнтів Intel про впровадження. Доставка й валідація цих даних відбуватимуться у міру надходження зразків у другій половині 2026 року та старту реальних розгортань у 2027 році.

Для ринку інференсу ШІ значення Crescent Island може полягати не у негайній зміні частки Nvidia, а у створенні чіткої альтернативи: у міру того як інференс стає основним сценарієм для інфраструктури ШІ, "достатньо й доступно" може стати життєздатною бізнес-моделлю поряд із "найпотужніше й найдорожче". Чи справдиться ця гіпотеза, покаже реальний ринок у найближчі 12–18 місяців.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Вподобати контент