18 апреля несколько источников из сферы венчурного капитала подтвердили, что DeepSeek начала свой первый раунд внешнего финансирования, сообщает (Pail News) со ссылкой на 澎湃新闻. Компания нацелена на оценку, превышающую $10 миллиардов, и планирует привлечь как минимум $300 миллионов для укрепления своих денежных резервов на фоне роста затрат в конкурентной борьбе в сфере ИИ — об этом говорится в сообщениях со ссылкой на осведомлённые источники.

Предыстория: прежний отказ от коммерциализации

Ранее DeepSeek получила признание в отрасли за отказ делать упор на коммерциализацию: компания опиралась на основателя Ляна Вэньфэна и поддержку со стороны Phantasm Capital. У компании имелись сильные технические возможности в сферах количественного трейдинга и интеллектуальных финансов, и она входила в число первых в Китае компаний, работающих с крупным модельным кластером из 10,000 карточных GPU.

Уход ключевых сотрудников

Несмотря на то, что DeepSeek стала заметной после её вирусного успеха во время китайского Нового года в прошлом году, компания столкнулась с существенными потерями талантов. По данным репортажа 澎湃新闻, с прошлого года ушли несколько ключевых исследователей, преимущественно молодые учёные «поколения пост-95s»:

Исследователь мультимодальной модели: 12 апреля компания YuanRong Autonomous Driving, занимающаяся беспилотными автомобилями, публично подтвердила, что Жуань Цун, один из ключевых участников мультимодальной модели DeepSeek, присоединился в качестве Главного учёного (Chief Scientist) и впервые выйдет на публику на Пекинском автосалоне.

Автор LLM первого поколения: Ван Бинсюань, ключевой автор первой большой языковой модели DeepSeek, недавно объявил о присоединении к Tencent.

Автор серии OCR: Вэй Хаоран, ключевой автор серии DeepSeek-OCR, покинул компанию примерно в период китайского Нового года в этом году, но не раскрыл публично своего нового работодателя.

Исследователь алгоритма GRPO: 16 апреля бывшего ключевого исследователя DeepSeek Го Дая, как сообщается, приняли в ByteDance, при этом сообщаемая зарплата составляет сотни миллионов юаней. Согласно связанным раскрытиям, Го Дая присоединился к организации Seed в ByteDance, отвечающей за исследования и разработку больших моделей, в качестве одного из ведущих по направлению (intelligent agent) на уровне L8. Го Дая идентифицируют как крупного вкладчика в алгоритм GRPO, который лежит в основе методологии тренировки рассуждений DeepSeek-R1. В тот же день Вице-президент группы ByteDance Ли Лян ответил, что репортаж неточен, и что компания в последнее время не нанимала сотрудников на ежегодные оклады на уровне почти ста миллионов юаней. Однако, по данным нескольких источников, подтверждённых 澎湃新闻, Го Дая действительно присоединился к ByteDance.

Исследователь в области deep learning: 12 ноября бывший ключевой исследователь DeepSeek Ло Фули публично объявила о присоединении к Xiaomi MiMo, указав в посте в социальных сетях: «Интеллект в итоге перейдёт от языка к физическому миру. Я нахожусь в Xiaomi MiMo, работаю вместе с группой креативных, талантливых и по-настоящему увлечённых исследователей, чтобы построить это будущее и добиваться AGI, которого мы себе представляем». Согласно открытой информации, Ло Фули окончила программу «Компьютерные науки» Пекинского педагогического университета и получила степень магистра в области вычислительной лингвистики в Пекинском университете. После получения степени магистра она присоединилась к Академии DAMO компании Alibaba в качестве исследователя лаборатории машинного интеллекта, разрабатывавшей многоязычную модель предварительного обучения VECO и продвигавшей open-source работу AliceMind. В 2022 году Ло Фули присоединилась к Phantasm Quantitative (родительская компания DeepSeek) для работ по deep learning, позже работала в качестве исследователя deep learning в DeepSeek и принимала участие в разработке моделей, включая DeepSeek-V2.

Утечка талантов в нескольких доменах

На основе вышеуказанной информации DeepSeek столкнулась с потерями ключевых талантов в нескольких доменах, включая базовые большие языковые модели (LLM), интеллектуальных агентов (Agent), оптическое распознавание символов (OCR) и мультимодальные технологии.

По данным отраслевых источников, уровень зарплат и компенсаций DeepSeek находится в середине рынка, а не является самым высоким. Однако сейчас хэдхантеры ускоряют переманивание талантов из команды DeepSeek — предлагая зарплаты в 2–3 раза выше и опции по доле в компании, тем самым ускоряя потери персонала.

Обновления платформы и ожидания по V4

8 апреля на DeepSeek были замечены обновления интерфейса: поле ввода теперь отображает варианты «Quick Mode» и «Expert Mode». Согласно отображению на веб-странице, Quick Mode подходит для ежедневных разговоров с немедленными ответами и поддерживает распознавание текста с изображений и файлов, тогда как Expert Mode лучше справляется со сложными задачами. Это знаменует собой первое внедрение многоуровневых режимов на официальной веб-странице DeepSeek.

Эти обновления вновь вызвали предположения о релизе DeepSeek V4. На основе сообщений внешних медиа и информации из социальных сетей, а также данных из нескольких источников, ожидается, что DeepSeek официально запустит V4 в апреле. Согласно внешним ожиданиям, если этот релиз V4 должен повторить феномен китайского Нового года прошлого года, то ему, несомненно, придётся столкнуться с более серьёзными вызовами, а потери персонала неизбежно повлияют на релиз V4.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные статьи

Polymarket: Обороты растут, ходят слухи о попытке привлечь финансирование для оценки в 15 млрд долларов

ChainNewsAbmedia04-20 04:31

Polymarket ведёт переговоры о новом раунде финансирования на 4 миллиарда долларов при оценке в 15 миллиардов долларов

Market Whisper04-20 03:37

Cursor ведёт переговоры о привлечении 2 млрд долларов, оценка стремится к 50 млрд: за три года с нуля до 2 млрд ARR, создав самый быстрый рекорд в истории B2B-программного обеспечения

ChainNewsAbmedia04-20 01:45

комментарий

0/400

GossipingOnlooker002

· 04-23 17:19

Мошеннический проект

Посмотреть ОригиналОтветить0

GateUser-fbbc916d

· 04-19 20:13

Оценка более 10 миллиардов долларов США свидетельствует о том, что институциональные инвесторы продолжают увеличивать свои ожидания относительно отечественных крупных моделей.

Посмотреть ОригиналОтветить0

GateUser-4bd1cc87

· 04-19 06:45

Если удастся привлечь 300 миллионов долларов, то дальнейшие вычислительные мощности и развитие экосистемы будут иметь уверенность.

Посмотреть ОригиналОтветить0

NarrativeCartographer

· 04-19 01:04

Беспокоит, не уедет ли темп разработки после поступления денег под влиянием KPI, не превратится ли это в чисто коммерческую нарративу.

Посмотреть ОригиналОтветить0

ByteSizedAlpha

· 04-19 00:49

Внешнее финансирование наконец-то прибыло, что можно считать ясным сигналом для рынка.

Посмотреть ОригиналОтветить0

GateUser-423f10e3

· 04-19 00:15

Больше всего интересно, как оно решит проблему затрат на вычислительную мощность и прибыльность на стороне вывода, иначе даже при высокой оценке не выдержит.

Посмотреть ОригиналОтветить0

GateUser-ae5cc7b3

· 04-19 00:13

10B оценки стоимости — стартовая точка? Слишком круто.

Посмотреть ОригиналОтветить0

AmberTeaSwirl

· 04-19 00:06

AI эта волна от технических соревнований к капиталистическим соревнованиям, DeepSeek официально вышла на игровое поле.

Посмотреть ОригиналОтветить0

FarmingNoSleep

· 04-18 23:58

Вхождение капитала также означает большую прозрачность, ожидается реализация большего количества продуктов.

Посмотреть ОригиналОтветить0

RugCheckSkeptic

· 04-18 23:55

Надеюсь, после финансирования смогут продолжить открывать исходный код / делиться некоторыми возможностями, а не сразу полностью закрывать все двери после получения финансирования.

Посмотреть ОригиналОтветить0

Подробнее