DeepSeek V4 provoca debate nos EUA: think tank questiona uso de chips, CEO da Replit defende inovação aberta

Mensagem do Gate News, 24 de abril — Uma discussão explodiu nos Estados Unidos sobre as capacidades tecnológicas e a conformidade do DeepSeek V4. Chris McGuire, um fellow sênior do Council on Foreign Relations (CFR) e ex-integrante do Conselho de Segurança Nacional da Casa Branca e do Departamento de Defesa, publicou uma análise argumentando que o V4 não mudou o panorama competitivo de IA EUA-China. De acordo com McGuire, o próprio relatório do DeepSeek sobre o V4 reconhece que suas capacidades de raciocínio ficam para trás em cerca de 3 a 6 meses em relação a modelos de ponta, fazendo benchmark com o GPT-5.2 e o Gemini 3.0 Pro lançados seis meses antes.

McGuire levantou preocupações de que, embora o relatório do V4 divulgue adaptação na etapa de inferência para GPUs NVIDIA e NPU Huawei Ascend, ele não especifica publicamente os modelos de GPU nem os custos de treinamento usados durante o desenvolvimento. Ele questionou se esse silêncio sugere o uso de chips NVIDIA Blackwell sujeitos a controle de exportação, observando que o V3 anteriormente afirmou usar 2.000 GPUs H800 a um custo de US$ 5,57 milhões. A DeepSeek negou o uso de Blackwell, afirmando que o modelo foi treinado em processadores NVIDIA H800 e Huawei Ascend 910C.

O CEO da Replit, Amjad Masad, rebateu a análise de McGuire, argumentando que cientistas chineses estão compartilhando publicamente avanços genuínos em IA, enquanto formuladores de políticas e lobistas americanos amplificam preocupações de "diluição chinesa". Masad destacou inovações arquiteturais divulgadas nas declarações oficiais do DeepSeek, incluindo compressão de atenção em nível de token (DeepSeek Sparse Attention) e melhorias significativas de eficiência para computação em contextos longos. Ele observou que o V4-Pro demonstra uma computação de inferência por token e requisitos de cache KV substancialmente mais baixos em comprimentos de contexto de 1M em comparação com o V3.2, enfatizando que esses avanços arquiteturais não têm relação com diluição de dados de treinamento e que todos os pesquisadores, inclusive laboratórios americanos, podem se beneficiar de desenvolvimentos de código aberto.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários