Інсайдери стверджують, що DeepSeek V4 перевершить Claude та ChatGPT у програмуванні, запуск відбудеться протягом кількох тижнів

2026-01-09 20:55:57

Коротко

DeepSeek V4 може з’явитися протягом кількох тижнів, орієнтуючись на високопродуктивне кодування рівня еліти.
Інсайдери стверджують, що він може перевершити Claude та ChatGPT у завданнях з довгим контекстом коду.
Розробники вже в захваті напередодні потенційних змін.

Згідно з повідомленнями, DeepSeek планує випустити свою модель V4 приблизно наприкінці лютого, і якщо внутрішні тести є будь-яким показником, гіганти штучного інтелекту з Кремнієвої долини мають бути налякані. Заснований у Ханчжоу AI-стартап може орієнтуватися на випуск приблизно 17 лютого — природно, в День Лунарного Нового року — з моделлю, спеціально розробленою для завдань з кодування, згідно з The Information. Люди, які мають прямі знання про проект, стверджують, що V4 перевищує за продуктивністю як Claude від Anthropic, так і серію GPT від OpenAI у внутрішніх бенчмарках, особливо при обробці дуже довгих кодових підказок. Звичайно, жоден бенчмарк або інформація про модель не були публічно оприлюднені, тому безпосередньо перевірити такі твердження неможливо. DeepSeek також не підтвердив чутки.

Проте, спільнота розробників не чекає офіційних слів. Reddit-спільноти r/DeepSeek та r/LocalLLaMA вже активно обговорюють, користувачі накопичують API-кредити, а ентузіасти на X швидко діляться своїми прогнозами, що V4 може закріпити позицію DeepSeek як бійця, що відмовляється грати за правилами Кремнієвої долини з мільярдними бюджетами.

Anthropic заблокував підписки на Claude у сторонніх додатках, таких як OpenCode, і, за повідомленнями, припинив доступ xAI та OpenAI.

Claude та Claude Code чудові, але ще не в 10 разів кращі. Це лише спонукатиме інші лабораторії швидше розвивати свої моделі/агенти для кодування.

Очікується, що DeepSeek V4 з’явиться…

— Ючен Джин (@Yuchenj_UW) 9 січня 2026

Це не буде першим порушенням для DeepSeek. Коли компанія випустила свою модель розуміння R1 у січні 2025 року, вона спричинила продажі на трильйон у глобальних ринках. Причина? R1 DeepSeek відповідає моделі o1 від OpenAI за бенчмарками з математики та логіки, при цьому, за повідомленнями, коштувала всього $1 мільйон на розробку — приблизно у 68 разів дешевше, ніж витрати конкурентів. Пізніше модель V3 досягла 90.2% у бенчмарку MATH-500, обігнавши Claude з 78.3%, а оновлення “V3.2 Speciale” покращило її продуктивність ще більше.

![]$6 https://img-cdn.gateio.im/social/moments-4455228819-a2dcd77083-8b7abd-e2c905(

Зображення: DeepSeek

Фокус на кодуванні у V4 стане стратегічним поворотом. У той час як R1 наголошував на чистому розумінні — логіці, математиці, формальних доведеннях — V4 є гібридною моделлю )з розумінням та без розуміння(, що орієнтована на корпоративний ринок розробників, де високоточне генерування коду безпосередньо перетворюється на дохід. Щоб домінувати, V4 потрібно буде перевершити Claude Opus 4.5, який наразі тримає рекорд SWE-bench Verified з 80.9%. Але якщо орієнтуватися на минулі запуски DeepSeek, то це може бути цілком досяжним навіть з урахуванням усіх обмежень, з якими стикається китайська лабораторія штучного інтелекту. Несподіваний секретний інгредієнт Якщо чутки правдиві, то як ця невелика лабораторія може досягти такого результату? Таємною зброєю компанії може бути її дослідження від 1 січня: Manifold-Constrained Hyper-Connections, або mHC. Співавтором цієї нової методики навчання є засновник Лян Веньфенг, і вона вирішує фундаментальну проблему масштабування великих мовних моделей — як розширити здатність моделі без її нестабільності або вибуху під час тренування. Традиційні архітектури штучного інтелекту змушують всю інформацію проходити через один вузький шлях. mHC розширює цей шлях у кілька потоків, які можуть обмінюватися інформацією без руйнування тренування. ![])https://img-cdn.gateio.im/social/moments-8df174b474-ddea3332bc-8b7abd-e2c905(

Зображення: DeepSeek

Вей Сан, головний аналітик з AI у Counterpoint Research, назвала mHC “вражаючим проривом” у коментарях до Business Insider. Вона зазначила, що ця техніка показує, що DeepSeek може “обійти обмеження обчислень і відкрити нові можливості в розумі”, навіть при обмеженому доступі до передових чипів через американські експортні обмеження. Лян Джей Су, головний аналітик у Omdia, відзначив, що готовність DeepSeek публікувати свої методи свідчить про “нову впевненість у китайській індустрії штучного інтелекту”. Відкритий підхід компанії зробив її улюбленицею серед розробників, які бачать у ній втілення того, чим раніше була OpenAI, перш ніж вона перейшла до закритих моделей і раундів залучення мільярдів.

Не всі переконані. Деякі розробники на Reddit скаржаться, що моделі розуміння DeepSeek марнують обчислення на прості завдання, тоді як критики стверджують, що бенчмарки компанії не відображають реальну складність світу. Один пост на Medium під назвою “DeepSeek — це погано, і я вже втомився імітувати, що це не так” став вірусним у квітні 2025 року, звинувачуючи моделі у створенні “шаблонного нісенітниці з багами” та “галюцинаційних бібліотеках”. DeepSeek також має свої проблеми. Питання конфіденційності турбують компанію, деякі уряди заборонили нативний додаток DeepSeek. Зв’язки компанії з Китаєм і питання цензури у її моделях додають геополітичного напруження до технічних дискусій. Проте, динаміка незаперечна. DeepSeek широко впроваджений в Азії, і якщо V4 виконає свої обіцянки щодо кодування, то й корпоративне впровадження у Заході може не забаритися. ![])https://img-cdn.gateio.im/social/moments-41500867df-9de4073531-8b7abd-e2c905(

Зображення: Microsoft

Ще один аспект — час. За даними Reuters, DeepSeek спочатку планував випустити модель R2 у травні 2025 року, але відтермінував її через незадоволення засновника Ляна її продуктивністю. Тепер, коли V4 нібито орієнтований на лютий, а R2 можливо з’явиться у серпні, компанія рухається з такою швидкістю, що натякає на терміновість — або впевненість. Можливо, і те, і інше.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.