DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости

Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode полностью поддерживают модели серии DeepSeek V4 благодаря тесному сотрудничеству между технологиями чипа и модели.

Ascend 950 обеспечивает развертывание инференса моделей DeepSeek V4 с высокой пропускной способностью и низкой задержкой за счет методов склеивания ядер и параллелизма в несколько потоков, чтобы снизить накладные расходы на вычисления Attention и обращения к памяти. Для DeepSeek V4-Pro с входом 8K Ascend 950 достигает примерно 20ms TPOT при 4,700 TPS на одно устройство в режиме Decode; для DeepSeek V4-Flash при входе до 8K он достигает примерно 10ms TPOT при пропускной способности 1,600 TPS. Серия Ascend A3 supernode также обеспечивает полную совместимость: предоставлены эталонные реализации для быстрого дообучения. На основе supernode Ascend A3 из 64 карт с большим режимом EP DeepSeek V4-Flash достигает более 2,000 TPS на одну карту в режиме Decode в сценариях вход-выход 8K/1K, используя движок инференса vLLM. Полные линейки продуктов Huawei Ascend A2, A3 и 950 поддерживают как DeepSeek V4-Flash, так и V4-Pro.

Huawei Cloud объявила о совместимости с DeepSeek V4 для самых первых, предоставив разработчикам сервисы API token в один клик через свою платформу MaaS. Huawei Cloud оптимизировала возможности системного уровня, уровня операторов и уровня кластера, чтобы обеспечить быструю адаптацию моделей и высокопроизводительное развертывание. Компании, включая Kingsoft WPS и 360, уже интегрировали новую модель DeepSeek через Huawei Cloud.

Cambricon также объявила о совместимости Day 0 с DeepSeek V4-Flash и V4-Pro на основе фреймворка инференса vLLM, а код адаптации был с открытым исходным кодом опубликован для сообщества GitHub. Ранее Cambricon уже достигла совместимости для самых первых при выпуске DeepSeek V3.2 в прошлом году: она провела глубокую оптимизацию совместной производительности ПО и оборудования на моделях серии DeepSeek.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Китай и США сталкиваются в схватке по ИИ из-за обвинений в дистилляции моделей и ограничений на инвестиции

Сообщение Gate News, 24 апреля — Китай отверг обвинения США в том, что его технологические гиганты используют американские технологии ИИ посредством дистилляции в промышленных масштабах, поскольку обе страны готовятся к серьезному столкновению из-за разработки ИИ и контроля над инвестициями. Администрация Трампа готовится к

GateNews7м назад

Google планирует инвестировать до $40 Billion в Anthropic, обещает 5+ гигаватт вычислительных мощностей

Сообщение Gate News, 24 апреля — Согласно рыночным источникам, Google планирует инвестировать в Anthropic до $40 миллиарда. Инвестиции начнутся с первоначальных $10 миллиарда наличными, а затем последуют до дополнительных $30 миллиарда в зависимости от достижения указанных вех. Google также предоставит Anthropic не менее 5 гигаватт вычислительных мощностей в рамках партнерства.

GateNews2ч назад

Швейцарский регулятор FINMA предупреждает, что инструмент ИИ Anthropic Mythos несет финансовые риски

Сообщение Gate News, 24 апреля — Финансовый надзорный орган Швейцарии (FINMA) заявил, что разрешение банкам быстро и удобно внедрять инструмент искусственного интеллекта Mythos от Anthropic будет создавать серьезные риски для

GateNews2ч назад

Fere AI завершает раунд финансирования на $1,3 млн под руководством Ethereal Ventures

Сообщение Gate News, 24 апреля — Fere AI, платформа для торговых агентов цифровыми активами с применением ИИ, объявила о завершении раунда финансирования на $1,3 млн, который возглавила Ethereal Ventures; в нем также участвовали Galaxy Vision Hill и Kosmos Ventures. Платформа поддерживает кроссчейн-сети, включая Ethereum,

GateNews3ч назад

Anthropic откатывает изменения Claude Code после снижения качества; все исправления завершены

Сообщение Gate News от 24 апреля — Anthropic признала недавнее снижение качества Claude Code и подтвердила, что все связанные проблемы были устранены с помощью откатов и исправлений. Проблемы возникли из-за трех изменений продукта и подсказок, внесенных в период между началом и серединой апреля. 4 марта,

GateNews5ч назад

Сооснователь NeoSoul Каэлан: Индустрия ИИ должна позволять существовать игрушкам; инновации часто начинаются с экспериментальных продуктов

Сообщение Gate News, 24 апреля — На недавнем форуме в Гонконге по интеллектуальным зашифрованным финансам сооснователь NeoSoul Каэлан поделился соображениями о том, как оценивать проекты в области ИИ на ранней стадии в быстро развивающейся индустрии ИИ. Помимо оценки текущих продуктов, команды должны продемонстрировать способность идти в ногу с возможностями базовой модели, заявил он.

GateNews5ч назад
комментарий
0/400
Нет комментариев