Соперничество Intel и Nvidia в области AI-инференса обостряется: сможет ли Crescent Island Xe3P изменить ландшафт дата-ц

Рынки
Обновлено: 03/06/2026 09:08

По мере того как индустрия искусственного интеллекта переключает внимание с обучения моделей на масштабную инференцию, структура затрат на вычислительные ресурсы претерпевает фундаментальные изменения. В июне 2026 года Intel представила на выставке Computex 2026 свой новый ускоритель инференции для дата-центров — Crescent Island. Это решение, построенное на архитектуре Xe3P и оснащённое памятью LPDDR5X, демонстрирует явный стратегический поворот для традиционного чипового гиганта в сфере инфраструктуры ИИ. Вместо прямой конкуренции с доминированием Nvidia на рынке обучения, Intel делает ставку на сегмент инференции, предлагая отличительную позицию: «низкая стоимость, достаточная производительность».

Анализ архитектуры продукта: технические основания Xe3P и LPDDR5X

Главная особенность Crescent Island заключается в архитектуре памяти. В отличие от большинства современных ускорителей обучения ИИ, которые используют память с высокой пропускной способностью, Intel выбрала LPDDR5X — зрелую, энергоэффективную технологию памяти, широко применяемую в мобильных устройствах и массовой потребительской электронике.

Согласно спецификациям, референсная версия оснащена 160 ГБ памяти LPDDR5X с возможностью расширения до 480 ГБ через партнёров ODM. Энергопотребление карты составляет 350 Вт, используется воздушное охлаждение, поддерживается полный спектр типов данных — от нативных FP4/MXFP4 до FP64. По расчётам TechTimes, исходя из 640-битного интерфейса памяти и скорости LPDDR5X 10,7 Гбит/с, пропускная способность памяти составляет примерно 684 ГБ/с, тогда как у Nvidia H200 с HBM3e этот показатель достигает около 4,8 ТБ/с. Этот разрыв критичен для задач обучения, но для масштабной инференции с высокой параллельностью и большими языковыми моделями маржинальная выгода от пропускной способности ниже, чем ценность энергоэффективности и стоимости. Intel подчёркивает, что этот чип «создан для Agentic AI», а ключевой метрикой выступает «Token/Watt» — максимальное количество обработанных запросов инференции на единицу энергии.

С точки зрения совместимости при внедрении, низкое энергопотребление LPDDR5X позволяет реализовать решение с воздушным охлаждением на 350 Вт. Это означает, что Crescent Island не требует специализированной инфраструктуры жидкостного охлаждения и может быть интегрирован напрямую в стандартные стойки и существующие дата-центры, снижая затраты на адаптацию после покупки.

Рыночный контекст: расширение и структурная дифференциация рынка инференции ИИ

Для понимания стратегической позиции Crescent Island важно сначала оценить масштаб и логику роста современного рынка инференции ИИ.

Существует несколько подходов к определению рынка инференции ИИ, поэтому различия принципиальны. Узкое определение — рынок чипов инференции ИИ (только аппаратные IC, без учёта ПО и сопутствующих сервисов) — прогнозируется рост с примерно $17,73 млрд в 2025 году до $20,51 млрд в 2026 году, среднегодовой темп роста — около 15,6%. Более широкое определение — рынок инференции ИИ (включая оборудование, программное обеспечение и платформенные сервисы) — составлял около $103,73 млрд в 2025 году и ожидается, что достигнет $117,8 млрд в 2026 году, CAGR — примерно 12,98%. Последний показатель отражает общий масштаб инфраструктурных инвестиций и является ареной конкуренции поставщиков дата-центров (CPU, GPU, сетевые решения, память, программные стеки).

Структурно задачи инференции быстро увеличивают свою долю в общем объёме вычислений ИИ. Эксперты платформы Nebius недавно отметили, что инференция составляет 90–95% корпоративного спроса на ИИ. Всё больше компаний используют предварительно обученные модели или API-сервисы вместо самостоятельного обучения базовых моделей. В результате ценность инфраструктуры ИИ смещается с «максимизации производительности обучения» к «оптимизации стоимости инференции». Более быстрый рост инференции по сравнению с обучением — логическая основа выхода Crescent Island на рынок.

Позиция Nvidia в обучении ИИ остаётся непререкаемой. Анализ отрасли показывает, что совокупная доля Nvidia на рынке ускорителей ИИ (обучение и инференция) превышает 70%, а в сегменте высокопроизводительного обучения приближается к монополии — 98%. Однако такая структура несёт риски: по мере того как инференция становится основным сценарием, «монопольная премия» от обучения — сейчас наиболее прибыльная часть доходов Nvidia — будет размываться, уступая место более масштабному, но менее маржинальному рынку инференции. Crescent Island стремится воспользоваться этим переходом.

Сравнительный анализ: различия в структуре затрат Intel и Nvidia

Конкуренция между Crescent Island и продуктами Nvidia — это по сути прямое столкновение двух принципиально разных кривых затрат для одной и той же задачи.

По данным Silicon Analysts, стоимость производства Nvidia H100 составляет около $3 320 (логическая пластина ~$300, HBM3 ~$1 350, упаковка CoWoS-S ~$750, тестирование/сборка ~$920). H200 с увеличенной ёмкостью HBM до 141 ГБ увеличивает себестоимость до ~$4 800. B200 использует двухкристальную архитектуру, снижая стоимость логической пластины, но увеличивая расходы на память и упаковку — всего около $6 400. Доля HBM в общей стоимости выросла с примерно 14% для A100 до 43% для H200, став главным переменным фактором затрат.

На рынке аренды цена H100 составляет примерно $2,95/час, H200 — около $3,50/час, B200 — от $4,90 до $6,50/час. При заключении контрактов на 1–2 года и минимальной партии от 10 000 штук цены существенно снижаются: H100 — ~$1,50/час, H200 — ~$2,20/час, B200 — ~$3,50/час. Примечательно, что после мая 2026 года цены на аренду H200 выросли — платформа Nebius увеличила стоимость H200 с $1,45 до $2,45/час с 1 июня 2026 года, что дополнительно повышает операционные расходы на инференцию.

Стоимость Crescent Island пока не объявлена, но цена LPDDR5X за единицу ёмкости значительно ниже, чем у HBM, профиль мощности 350 Вт снижает расходы на электроэнергию и охлаждение, а воздушное охлаждение упрощает инфраструктуру дата-центра. Это создаёт теоретическую возможность для общего владения Crescent Island по стоимости значительно ниже аналогичных решений Nvidia. Руководитель Data Center Group Intel Кеворк Кечичян сообщил Financial Times, что Crescent Island будет избегать конкуренции с Nvidia в обучении, сосредотачиваясь на задачах инференции, обслуживающих пользовательские запросы, с основной целью — снижение затрат на оборудование и охлаждение для клиентов ИИ.

В плане поставок Intel планирует предоставить образцы клиентам во второй половине 2026 года и начать ограниченные поставки до конца года. Масштабная валидация внедрения, вероятно, завершится к началу 2027 года.

Стратегические перспективы: дисбаланс спроса и предложения в инференции и позиция Intel

Структурная проблема современного рынка инференции заключается в том, что GPU, разработанные для обучения, обладают избыточной пропускной способностью и вычислительной мощностью, которые часто простаивают в сценариях инференции. Предприятия, приобретающие топовые GPU для пиковых нагрузок инференции, сталкиваются с постоянными избыточными капиталовложениями в период стабильной работы. Crescent Island занимает позицию на этом пересечении — предлагая «достаточную инференцию» вместо «избыточных вычислений для обучения», что позволяет снизить как первоначальные, так и текущие расходы.

Этот подход логически схож с решениями новых игроков, ориентированных на инференцию, таких как Groq. Однако Intel обладает более комплексными возможностями интеграции на уровне систем. На Computex 2026 компания также представила инфраструктурные решения для ИИ в масштабе стойки, строя гетерогенные архитектуры инференции на базе процессоров Xeon 6+ и RDU (Reconfigurable Dataflow Unit) SambaNova, охватывая весь вычислительный цикл — от чипа до стойки. Основная конкурентная логика заключается в том, что по мере смещения узких мест ИИ с чистых вычислений на перемещение данных, оркестрацию задач и координацию систем возрастает ценность CPU как универсального управляющего слоя — а именно здесь у Intel глубокие инфраструктурные резервы.

Что касается программной экосистемы, CUDA Nvidia за более чем 20 лет сформировала исключительную лояльность разработчиков — более 5 млн специалистов создают приложения ИИ, и свыше 90% задач обучения ИИ выполняются на CUDA. Intel продолжает развивать единую платформу программирования oneAPI; версия 2026.0 объединяет Base Toolkit и HPC Toolkit в один пакет, предлагая унифицированную модель программирования для CPU, GPU, FPGA и ускорителей, оптимизированную для новейших процессоров Xeon и видеокарт Arc для обучения и инференции. Однако миграция с CUDA на oneAPI остаётся затратной: текущие инструменты авто-конвертации CUDA-to-DPC++ переводят около 90–95% кода, но оставшиеся части требуют ручной доработки и настройки. Эта «стоимость трения» существенно влияет на скорость и масштаб внедрения Crescent Island в сценариях инференции.

Риски и переменные

Ключевые переменные риска включают:

Во-первых, данные о производительности не раскрыты. На момент презентации на Computex в июне 2026 года Intel не предоставила конкретных вычислительных бенчмарков для Crescent Island. Разрыв между фактической производительностью и ожиданиями рынка станет решающим фактором принятия продукта.

Во-вторых, волатильность цепочки поставок HBM. Выбор LPDDR5X подразумевает, что ёмкость HBM останется ограниченной на годы вперёд. Ожидается, что цены на HBM3e вырастут на 15–20% в ближайших кварталах, мощности упаковки CoWoS остаются дефицитными на 40–50%, сроки выполнения заказов увеличиваются до 40–52 недель. Если цепочка поставок HBM существенно стабилизируется в 2027–2028 годах, премия за продукты на HBM уменьшится, а маржинальное преимущество LPDDR5X снизится.

В-третьих, затраты на миграцию экосистемы. «Ров» экосистемы CUDA — это конкурентное преимущество, выходящее за рамки технической логики. Для крупных предприятий с обширными кодовыми базами обучения и инференции затраты на миграцию включают не только технические аспекты, но и организационную инерцию, кадровые ресурсы и оценку рисков. Этот нетехнический барьер зачастую сложнее преодолеть, чем чисто технические спецификации.

В-четвёртых, макроциклы спроса. Успех Crescent Island зависит от внедрения у операторов гипермасштабных дата-центров. На июнь 2026 года валидация клиентских внедрений Intel находится на ранней стадии. Чип Maia 2 AI от Microsoft использует процесс Intel 18A, но Maia 2 — это кастомный ASIC для инференции, отличающийся по позиционированию от Crescent Island. Google Cloud и AWS поддерживают тесное сотрудничество с процессорами Intel Xeon на уровне CPU, но вопрос использования Crescent Island для ускорения инференции ИИ пока открыт.

Заключение: проверяемый вызов низкозатратной инференции

Техническая логика Crescent Island имеет чёткую основу для выхода на рынок: задачи инференции быстро растут, предложение HBM ограничено, а маржинальные затраты на расширение дата-центров продолжают увеличиваться. Однако правильное направление не гарантирует результата.

Рынок нуждается не в теоретическом обосновании «почему Crescent Island может добиться успеха», а в проверяемых данных — опубликованных метриках вычислений (TOPS или TFLOPS), конкретных показателях Token/Watt и реальных отзывах клиентов Intel о внедрении. Поставка и валидация этих данных начнутся с появлением образцов во второй половине 2026 года и реальных внедрений в 2027 году.

Для рынка инференции ИИ значение Crescent Island может заключаться не в немедленном изменении доли Nvidia, а в появлении явной альтернативы: по мере того как инференция становится основным сценарием инфраструктуры ИИ, «достаточно и доступно» может стать жизнеспособной бизнес-моделью наряду с «самым мощным и дорогим». Действительность этой гипотезы покажет рынок в ближайшие 12–18 месяцев.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Нравится содержание