DeepSeek подтверждает первое внешнее раундовое финансирование
18 апреля несколько источников из сферы венчурного капитала подтвердили, что DeepSeek начала свой первый раунд внешнего финансирования, сообщает (Pail News) со ссылкой на 澎湃新闻. Компания нацелена на оценку, превышающую $10 миллиардов, и планирует привлечь как минимум $300 миллионов для укрепления своих денежных резервов на фоне роста затрат в конкурентной борьбе в сфере ИИ — об этом говорится в сообщениях со ссылкой на осведомлённые источники.
Предыстория: прежний отказ от коммерциализации
Ранее DeepSeek получила признание в отрасли за отказ делать упор на коммерциализацию: компания опиралась на основателя Ляна Вэньфэна и поддержку со стороны Phantasm Capital. У компании имелись сильные технические возможности в сферах количественного трейдинга и интеллектуальных финансов, и она входила в число первых в Китае компаний, работающих с крупным модельным кластером из 10,000 карточных GPU.
Уход ключевых сотрудников
Несмотря на то, что DeepSeek стала заметной после её вирусного успеха во время китайского Нового года в прошлом году, компания столкнулась с существенными потерями талантов. По данным репортажа 澎湃新闻, с прошлого года ушли несколько ключевых исследователей, преимущественно молодые учёные «поколения пост-95s»:
Исследователь мультимодальной модели: 12 апреля компания YuanRong Autonomous Driving, занимающаяся беспилотными автомобилями, публично подтвердила, что Жуань Цун, один из ключевых участников мультимодальной модели DeepSeek, присоединился в качестве Главного учёного (Chief Scientist) и впервые выйдет на публику на Пекинском автосалоне.
Автор LLM первого поколения: Ван Бинсюань, ключевой автор первой большой языковой модели DeepSeek, недавно объявил о присоединении к Tencent.
Автор серии OCR: Вэй Хаоран, ключевой автор серии DeepSeek-OCR, покинул компанию примерно в период китайского Нового года в этом году, но не раскрыл публично своего нового работодателя.
Исследователь алгоритма GRPO: 16 апреля бывшего ключевого исследователя DeepSeek Го Дая, как сообщается, приняли в ByteDance, при этом сообщаемая зарплата составляет сотни миллионов юаней. Согласно связанным раскрытиям, Го Дая присоединился к организации Seed в ByteDance, отвечающей за исследования и разработку больших моделей, в качестве одного из ведущих по направлению (intelligent agent) на уровне L8. Го Дая идентифицируют как крупного вкладчика в алгоритм GRPO, который лежит в основе методологии тренировки рассуждений DeepSeek-R1. В тот же день Вице-президент группы ByteDance Ли Лян ответил, что репортаж неточен, и что компания в последнее время не нанимала сотрудников на ежегодные оклады на уровне почти ста миллионов юаней. Однако, по данным нескольких источников, подтверждённых 澎湃新闻, Го Дая действительно присоединился к ByteDance.
Исследователь в области deep learning: 12 ноября бывший ключевой исследователь DeepSeek Ло Фули публично объявила о присоединении к Xiaomi MiMo, указав в посте в социальных сетях: «Интеллект в итоге перейдёт от языка к физическому миру. Я нахожусь в Xiaomi MiMo, работаю вместе с группой креативных, талантливых и по-настоящему увлечённых исследователей, чтобы построить это будущее и добиваться AGI, которого мы себе представляем». Согласно открытой информации, Ло Фули окончила программу «Компьютерные науки» Пекинского педагогического университета и получила степень магистра в области вычислительной лингвистики в Пекинском университете. После получения степени магистра она присоединилась к Академии DAMO компании Alibaba в качестве исследователя лаборатории машинного интеллекта, разрабатывавшей многоязычную модель предварительного обучения VECO и продвигавшей open-source работу AliceMind. В 2022 году Ло Фули присоединилась к Phantasm Quantitative (родительская компания DeepSeek) для работ по deep learning, позже работала в качестве исследователя deep learning в DeepSeek и принимала участие в разработке моделей, включая DeepSeek-V2.
Утечка талантов в нескольких доменах
На основе вышеуказанной информации DeepSeek столкнулась с потерями ключевых талантов в нескольких доменах, включая базовые большие языковые модели (LLM), интеллектуальных агентов (Agent), оптическое распознавание символов (OCR) и мультимодальные технологии.
По данным отраслевых источников, уровень зарплат и компенсаций DeepSeek находится в середине рынка, а не является самым высоким. Однако сейчас хэдхантеры ускоряют переманивание талантов из команды DeepSeek — предлагая зарплаты в 2–3 раза выше и опции по доле в компании, тем самым ускоряя потери персонала.
Обновления платформы и ожидания по V4
8 апреля на DeepSeek были замечены обновления интерфейса: поле ввода теперь отображает варианты «Quick Mode» и «Expert Mode». Согласно отображению на веб-странице, Quick Mode подходит для ежедневных разговоров с немедленными ответами и поддерживает распознавание текста с изображений и файлов, тогда как Expert Mode лучше справляется со сложными задачами. Это знаменует собой первое внедрение многоуровневых режимов на официальной веб-странице DeepSeek.
Эти обновления вновь вызвали предположения о релизе DeepSeek V4. На основе сообщений внешних медиа и информации из социальных сетей, а также данных из нескольких источников, ожидается, что DeepSeek официально запустит V4 в апреле. Согласно внешним ожиданиям, если этот релиз V4 должен повторить феномен китайского Нового года прошлого года, то ему, несомненно, придётся столкнуться с более серьёзными вызовами, а потери персонала неизбежно повлияют на релиз V4.