Em 18 de abril, múltiplas fontes de venture capital confirmaram que a DeepSeek deu início à sua primeira rodada de captação externa, de acordo com澎湃新闻 (Pail News). A empresa está mirando uma avaliação que exceda $10 bilhão e planeja levantar pelo menos $300 milhão para reforçar suas reservas de capital diante do aumento dos custos na disputa pela IA, segundo reportagens que citam fontes com conhecimento.

Contexto: rejeição anterior à comercialização

A DeepSeek ganhou anteriormente reconhecimento na indústria por rejeitar o foco na comercialização, apoiando-se no fundador Liang Wenfeng e no respaldo da Phantasm Capital. A empresa possuía fortes capacidades técnicas nos setores de trading quantitativo e finanças inteligentes e esteve entre as primeiras empresas de grandes modelos da China a operar um cluster de GPU de 10.000 placas.

Saídas de pessoal-chave

Apesar da proeminência da DeepSeek após seu sucesso viral durante o Ano Novo Chinês do ano passado, a empresa vem enfrentando perdas significativas de talentos. De acordo com a reportagem de澎湃新闻, múltiplos pesquisadores centrais deixaram a empresa desde o ano passado, principalmente jovens cientistas “pós-95”:

Pesquisador de modelo multimodal: Em 12 de abril, a empresa de direção autônoma YuanRong Autônoma de Direção confirmou publicamente que Ruan Cong, um contribuinte central para o modelo multimodal da DeepSeek, se juntou como Cientista-Chefe e fará sua primeira aparição pública na Beijing Auto Show.

Autor do primeiro LLM: Wang Bingxuan, autor central do primeiro modelo de linguagem de grande porte da DeepSeek, anunciou recentemente ter se juntado à Tencent.

Autor da série de OCR: Wei Haoran, autor central da série DeepSeek-OCR, deixou a empresa por volta do Ano Novo Chinês deste ano, mas não divulgou publicamente seu novo empregador.

Pesquisador do algoritmo GRPO: Em 16 de abril, o ex-pesquisador central da DeepSeek Guo Daya foi reportado como tendo se juntado à ByteDance com um salário reportado na casa das centenas de milhões de yuan. De acordo com divulgações relacionadas, Guo Daya se juntou à organização Seed da ByteDance responsável por pesquisa e desenvolvimento de grandes modelos como um dos líderes de direção de agente (intelligent agent) na camada L8. Guo Daya é identificado como um grande contribuinte para o algoritmo GRPO, que é central para a metodologia de treinamento de raciocínio do DeepSeek-R1. No mesmo dia, o vice-presidente do Grupo ByteDance, Li Liang, respondeu que o relatório era impreciso e que a empresa não contratou recentemente funcionários com salários anuais próximos a centenas de milhões de yuan. No entanto, de acordo com múltiplas fontes confirmadas por澎湃新闻, Guo Daya de fato se juntou à ByteDance.

Pesquisador de aprendizado profundo: Em 12 de novembro, o ex-pesquisador central da DeepSeek Luo Fuli anunciou publicamente ter se juntado à Xiaomi MiMo, afirmando em uma postagem em rede social: “A inteligência eventualmente vai transitar do idioma para o mundo físico. Estou na Xiaomi MiMo, trabalhando com um grupo de pesquisadores criativos, talentosos e genuinamente apaixonados para construir este futuro e buscar a AGI que imaginamos.” De acordo com informações públicas, Luo Fuli se formou no programa de Ciência da Computação da Beijing Normal University e concluiu um mestrado em linguística computacional na Peking University. Após seu mestrado, ela se juntou ao Alibaba DAMO Academy como pesquisadora do laboratório de inteligência de máquina, desenvolvendo o modelo de pré-treinamento multilíngue VECO e promovendo o trabalho open-source AliceMind. Em 2022, Luo Fuli se juntou à Phantasm Quantitative (empresa-mãe da DeepSeek) para trabalhos de aprendizado profundo, mais tarde atuando como pesquisadora de aprendizado profundo da DeepSeek e participando do desenvolvimento de modelos incluindo DeepSeek-V2.

Fuga de talentos entre múltiplos domínios

Com base nas informações acima, a DeepSeek passou por perdas de talentos centrais em múltiplos domínios, incluindo grandes modelos de linguagem de base (LLM), agentes inteligentes (Agent), reconhecimento óptico de caracteres (OCR) e tecnologias multimodais.

De acordo com fontes da indústria, o nível de salários e compensações da DeepSeek está na faixa intermediária na indústria, não sendo o mais alto. Entretanto, headhunters estão acelerando atualmente a captura de talentos a partir da equipe da DeepSeek com salários 2-3x maiores e opções de equity, acelerando as perdas de pessoal.

Atualizações de plataforma e expectativas para a V4

Em 8 de abril, foram observadas atualizações na nova interface da DeepSeek: a caixa de entrada agora exibe as opções “Quick Mode” e “Expert Mode”. De acordo com a exibição na página da web, o Quick Mode é adequado para conversas diárias com respostas imediatas e oferece suporte ao reconhecimento de texto a partir de imagens e arquivos, enquanto o Expert Mode se destaca em problemas complexos. Isso marca a primeira introdução de modos em camadas no site oficial da DeepSeek.

Essas atualizações renovaram a especulação sobre o lançamento da V4 da DeepSeek. Com base em reportagens da mídia externa e informações de redes sociais e múltiplas fontes, a DeepSeek deve lançar formalmente a V4 em abril. De acordo com expectativas externas, se este lançamento da V4 for replicar o fenômeno do Ano Novo Chinês do ano passado, ele certamente enfrentará desafios maiores, e as perdas de pessoal inevitavelmente afetarão o lançamento da V4.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

O volume de negócios da Polymarket disparou, com rumores de uma rodada de financiamento para desafiar uma avaliação de US$ 15 bilhões

ChainNewsAbmedia04-20 04:31

Polymarket avaliado em US$ 15 bilhões, em negociações para uma nova rodada de financiamento de US$ 400 milhões

Market Whisper04-20 03:37

A empresa Cursor faz contato para captação de US$ 2 bilhões, com avaliação visando US$ 50 bilhões: em três anos, saiu do zero até US$ 2 bilhões em ARR, estabelecendo o registro mais rápido da história do software B2B

ChainNewsAbmedia04-20 01:45

Comentário

0/400

GossipingOnlooker002

· 04-23 17:19

Projeto de enganação

Ver originalResponder0

GateUser-fbbc916d

· 04-19 20:13

Avaliação > 10 bilhões de dólares, indicando que as instituições ainda estão aumentando suas expectativas sobre o potencial dos grandes modelos nacionais.

Ver originalResponder0

GateUser-4bd1cc87

· 04-19 06:45

Se conseguir captar 300 milhões de dólares, a capacidade de processamento e a construção do ecossistema terão mais respaldo.

Ver originalResponder0

NarrativeCartographer

· 04-19 01:04

A preocupação é se, após o dinheiro entrar, o ritmo de desenvolvimento será desviado pelos KPIs, para não se transformar em uma narrativa puramente comercial.

Ver originalResponder0

ByteSizedAlpha

· 04-19 00:49

O financiamento externo finalmente chegou, dando ao mercado um sinal claro.

Ver originalResponder0

GateUser-423f10e3

· 04-19 00:15

Estou mais interessado em ver como ele resolve os custos de computação e a margem de lucro na inferência, caso contrário, mesmo com uma avaliação alta, não vai aguentar.

Ver originalResponder0

GateUser-ae5cc7b3

· 04-19 00:13

Começando com uma avaliação de 10 bilhões? Isso é incrível.

Ver originalResponder0

AmberTeaSwirl

· 04-19 00:06

A onda da IA, que passou de uma competição técnica para uma competição de capital, a DeepSeek realmente entrou na disputa.

Ver originalResponder0

FarmingNoSleep

· 04-18 23:58

A entrada de capital também significa maior transparência, esperando que mais produtos sejam implementados.

Ver originalResponder0

RugCheckSkeptic

· 04-18 23:55

Espero que, após o financiamento, possam continuar a abrir o código / abrir algumas funcionalidades, e não fechar completamente as portas logo após obter o financiamento.

Ver originalResponder0

Ver projetos