Gate News сообщение, 25 апреля — DeepSeek выпустила предварительные версии V4-Pro и V4-Flash 24 апреля; обе — модели с открытыми весами и контекстным окном на один миллион токенов. V4-Pro включает 1,6 трлн общих параметров, но активирует только 49 млрд за один проход инференса, используя архитектуру Mixture-of-Experts. V4-Flash включает 284 млрд общих параметров с 13 млрд активными.
Цены заметно ниже, чем у конкурентов: V4-Pro стоит $1.74 за миллион токенов входных данных и $3.48 за миллион токенов выходных данных — примерно на 98% меньше, чем OpenAI GPT-5.5 Pro ($30 input, $180 output), и примерно в одну двадцатую раза дешевле, чем Claude Opus 4.7. V4-Flash стоит $0.14 на вход и $0.28 на выход за миллион токенов. Обе модели — с открытым исходным кодом по лицензии MIT, и их можно бесплатно запускать локально.
DeepSeek добилась прироста эффективности за счет двух новых механизмов внимания: Compressed Sparse Attention и Heavily Compressed Attention, которые снижают вычислительные затраты до 27% от предшественника V4-Pro (V3.2) и до 10% для V4-Flash. Компания частично обучала V4 на чипах Huawei Ascend, обходя ограничения США на экспорт продвинутых процессоров Nvidia. DeepSeek заявила, что после запуска 950 новых суперузлов в конце 2026 года цены снизятся еще сильнее.
По результатам тестов на производительность, V4-Pro-Max занимает первое место на Codeforces в конкурентном программировании (3,206 балла, располагаясь примерно на 23-м месте среди участников-людей) и набирая 90.2% на задачах математики Apex Shortlist против 85.9% у Claude Opus 4.6. Однако на тестах на многозадачность он уступает: MMLU-Pro (87.5% против 91.0% у Gemini-3.1-Pro) и Humanity's Last Exam (37.7% против 44.4%). В задачах с длинным контекстом V4-Pro лидирует среди моделей с открытым исходным кодом, но уступает Claude Opus 4.6 в тестах извлечения MRCR.
V4-Pro вводит «interleaved thinking» («перемежающееся мышление»), позволяя агентским сценариям сохранять контекст рассуждений в процессе множества вызовов инструментов без «сброса» между шагами. Обе модели поддерживают интеграции для кодинга с Claude Code и OpenCode. Согласно опросу разработчиков DeepSeek среди 85 пользователей, 52% заявили, что V4-Pro готов быть их агентом по умолчанию для написания кода, а 39% склоняются к внедрению. Старые endpoints deepseek-chat и deepseek-reasoner будут сняты 24 июля 2026 года.