Повідомлення Gate News, 25 квітня — DeepSeek випустила прев’ю-версії V4-Pro та V4-Flash 24 квітня; обидві — моделі з відкритими вагами з контекстними вікнами на один мільйон токенів. V4-Pro має 1,6 трильйона загальних параметрів, але активує лише 49 мільярдів за один прохід виведення, використовуючи архітектуру Mixture-of-Experts. V4-Flash має 284 мільярди загальних параметрів із 13 мільярдами активними.

Ціни суттєво нижчі, ніж у конкурентів: V4-Pro коштує $1,74 за мільйон вхідних токенів і $3,48 за мільйон вихідних токенів — приблизно на 98% менше, ніж GPT-5.5 Pro від OpenAI ($30 input, $180 output), і приблизно у двадцяту частину вартості Claude Opus 4.7. V4-Flash коштує $0,14 за вхід і $0,28 за вихід на мільйон токенів. Обидві моделі є відкритим кодом під ліцензією MIT і можуть працювати локально безкоштовно.

DeepSeek досягла приросту ефективності завдяки двом новим механізмам уваги: Compressed Sparse Attention і Heavily Compressed Attention, які знижують обчислювальні витрати до 27% від попередника V4-Pro (V3.2) та до 10% для V4-Flash. Компанія частково навчала V4 на чипах Huawei Ascend, обходячи обмеження на експорт передових процесорів Nvidia зі США. DeepSeek заявила, що після виходу на роботу 950 нових супервузлів у другій половині 2026 року ціни знижуватимуться ще далі.

На бенчмарках продуктивності V4-Pro-Max посідає перше місце в Codeforces competitive programming (3,206 score, що ставить його приблизно на 23-тє місце серед людських учасників) і дає 90,2% за задачами з математики Apex Shortlist проти 85,9% у Claude Opus 4.6. Однак він відстає на бенчмарках багатозадачності: MMLU-Pro (87,5% проти 91,0% у Gemini-3.1-Pro) та 37,7% у Humanity's Last Exam ( проти 44,4%). У задачах із довгим контекстом V4-Pro лідирує серед моделей з відкритим кодом, але програє Claude Opus 4.6 у тестах MRCR з пошуку.

V4-Pro додає «interleaved thinking», що дозволяє агентним робочим процесам зберігати контекст міркувань упродовж кількох викликів інструментів без очищення між кроками. Обидві моделі підтримують інтеграції для програмування з Claude Code та OpenCode. Згідно з опитуванням розробників DeepSeek серед 85 користувачів, 52% заявили, що V4-Pro готовий бути їхнім агентом для програмування за замовчуванням, а 39% схилялися до впровадження. Старі кінцеві точки deepseek-chat і deepseek-reasoner буде припинено 24 липня 2026 року.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

04-25 06:12

IPO SpaceX, OpenAI та Anthropic можуть залучити понад $240 мільярд, потенційно вплинувши на ліквідність крипторинку

04-25 02:51

Стартап з розробки коду за допомогою ШІ Cognition веде переговори про фінансування за оцінкою $25B

04-25 02:29

Google інвестує $10B в Anthropic за оцінкою $350B до угоди (pre-money), з додатковими $30B , прив’язаними до показників ефективності

04-24 15:53

Alphabet інвестуватиме до $40 мільярда в Anthropic, посилюючи конкуренцію в сфері ШІ

04-24 00:27

Cognition AI залучає фінансування за оцінкою $25B на ранній стадії переговорів

Поглиблений аналіз

Google додає ще 40 мільярдів доларів інвестицій в Anthropic: спочатку 10 мільярдів, а потім, залежно від результатів, розблокують 30 мільярдів, а також надають обчислювальні потужності 5 ГВт TPU

ChainNewsAbmedia04-25 07:14

Anthropic 二级市场估值突破 1 万亿美元：Forge Global 反超 OpenAI 的 8,800 亿

ChainNewsAbmedia04-24 07:14

DeepSeek запустила V4 відкриту прев’ю-версію, технічний рейтинг 3206 перевершив GPT-5.4

Market Whisper04-24 05:38

Прокоментувати

0/400

Немає коментарів