DeepSeek випускає моделі V4-Pro і V4-Flash із 98% нижчою вартістю, ніж у GPT-5.5 Pro від OpenAI

Повідомлення Gate News, 25 квітня — DeepSeek випустила прев’ю-версії V4-Pro та V4-Flash 24 квітня; обидві — моделі з відкритими вагами з контекстними вікнами на один мільйон токенів. V4-Pro має 1,6 трильйона загальних параметрів, але активує лише 49 мільярдів за один прохід виведення, використовуючи архітектуру Mixture-of-Experts. V4-Flash має 284 мільярди загальних параметрів із 13 мільярдами активними.

Ціни суттєво нижчі, ніж у конкурентів: V4-Pro коштує $1,74 за мільйон вхідних токенів і $3,48 за мільйон вихідних токенів — приблизно на 98% менше, ніж GPT-5.5 Pro від OpenAI ($30 input, $180 output), і приблизно у двадцяту частину вартості Claude Opus 4.7. V4-Flash коштує $0,14 за вхід і $0,28 за вихід на мільйон токенів. Обидві моделі є відкритим кодом під ліцензією MIT і можуть працювати локально безкоштовно.

DeepSeek досягла приросту ефективності завдяки двом новим механізмам уваги: Compressed Sparse Attention і Heavily Compressed Attention, які знижують обчислювальні витрати до 27% від попередника V4-Pro (V3.2) та до 10% для V4-Flash. Компанія частково навчала V4 на чипах Huawei Ascend, обходячи обмеження на експорт передових процесорів Nvidia зі США. DeepSeek заявила, що після виходу на роботу 950 нових супервузлів у другій половині 2026 року ціни знижуватимуться ще далі.

На бенчмарках продуктивності V4-Pro-Max посідає перше місце в Codeforces competitive programming (3,206 score, що ставить його приблизно на 23-тє місце серед людських учасників) і дає 90,2% за задачами з математики Apex Shortlist проти 85,9% у Claude Opus 4.6. Однак він відстає на бенчмарках багатозадачності: MMLU-Pro (87,5% проти 91,0% у Gemini-3.1-Pro) та 37,7% у Humanity's Last Exam ( проти 44,4%). У задачах із довгим контекстом V4-Pro лідирує серед моделей з відкритим кодом, але програє Claude Opus 4.6 у тестах MRCR з пошуку.

V4-Pro додає «interleaved thinking», що дозволяє агентним робочим процесам зберігати контекст міркувань упродовж кількох викликів інструментів без очищення між кроками. Обидві моделі підтримують інтеграції для програмування з Claude Code та OpenCode. Згідно з опитуванням розробників DeepSeek серед 85 користувачів, 52% заявили, що V4-Pro готовий бути їхнім агентом для програмування за замовчуванням, а 39% схилялися до впровадження. Старі кінцеві точки deepseek-chat і deepseek-reasoner буде припинено 24 липня 2026 року.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів