Gate News сообщение, 25 апреля — DeepSeek выпустила предварительные версии V4-Pro и V4-Flash 24 апреля; обе — модели с открытыми весами и контекстным окном на один миллион токенов. V4-Pro включает 1,6 трлн общих параметров, но активирует только 49 млрд за один проход инференса, используя архитектуру Mixture-of-Experts. V4-Flash включает 284 млрд общих параметров с 13 млрд активными.

Цены заметно ниже, чем у конкурентов: V4-Pro стоит $1.74 за миллион токенов входных данных и $3.48 за миллион токенов выходных данных — примерно на 98% меньше, чем OpenAI GPT-5.5 Pro ($30 input, $180 output), и примерно в одну двадцатую раза дешевле, чем Claude Opus 4.7. V4-Flash стоит $0.14 на вход и $0.28 на выход за миллион токенов. Обе модели — с открытым исходным кодом по лицензии MIT, и их можно бесплатно запускать локально.

DeepSeek добилась прироста эффективности за счет двух новых механизмов внимания: Compressed Sparse Attention и Heavily Compressed Attention, которые снижают вычислительные затраты до 27% от предшественника V4-Pro (V3.2) и до 10% для V4-Flash. Компания частично обучала V4 на чипах Huawei Ascend, обходя ограничения США на экспорт продвинутых процессоров Nvidia. DeepSeek заявила, что после запуска 950 новых суперузлов в конце 2026 года цены снизятся еще сильнее.

По результатам тестов на производительность, V4-Pro-Max занимает первое место на Codeforces в конкурентном программировании (3,206 балла, располагаясь примерно на 23-м месте среди участников-людей) и набирая 90.2% на задачах математики Apex Shortlist против 85.9% у Claude Opus 4.6. Однако на тестах на многозадачность он уступает: MMLU-Pro (87.5% против 91.0% у Gemini-3.1-Pro) и Humanity's Last Exam (37.7% против 44.4%). В задачах с длинным контекстом V4-Pro лидирует среди моделей с открытым исходным кодом, но уступает Claude Opus 4.6 в тестах извлечения MRCR.

V4-Pro вводит «interleaved thinking» («перемежающееся мышление»), позволяя агентским сценариям сохранять контекст рассуждений в процессе множества вызовов инструментов без «сброса» между шагами. Обе модели поддерживают интеграции для кодинга с Claude Code и OpenCode. Согласно опросу разработчиков DeepSeek среди 85 пользователей, 52% заявили, что V4-Pro готов быть их агентом по умолчанию для написания кода, а 39% склоняются к внедрению. Старые endpoints deepseek-chat и deepseek-reasoner будут сняты 24 июля 2026 года.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

04-25 06:12

IPO SpaceX, OpenAI и Anthropic могут привлечь более $240 миллиарда, потенциально повлияв на ликвидность крипторынка

04-25 02:51

Стартап по ИИ-разработке Cognition ведет переговоры о раунде финансирования при оценке в $25B

04-25 02:29

Google Инвестирует $10B в Anthropic при оценке $350B Pre-Money; до $30B Дополнительно привязано к вехам по результатам

04-24 15:53

Alphabet инвестирует до $40 Billion в Anthropic, усиливая конкуренцию в сфере ИИ

04-24 00:27

Cognition AI привлекает финансирование при оценке $25B в рамках ранних переговоров

Детальный анализ

Google удваивает ставку: инвестирует $40 млрд в Anthropic: сначала $10 млрд, затем $30 млрд — по результатам, выделяя вычислительные мощности TPU на 5 ГВт

ChainNewsAbmedia04-25 07:14

Оценка вторичного рынка Anthropic превысила 1 трлн долларов: Forge Global обошла OpenAI на 880 млрд

ChainNewsAbmedia04-24 07:14

DeepSeek выпускает V4 open-source preview, технический рейтинг 3206 превзошёл GPT-5.4

Market Whisper04-24 05:38

комментарий

0/400

Нет комментариев