DeepSeek Lança os Modelos V4-Pro e V4-Flash com Custo 98% Menor do que o GPT-5.5 Pro da OpenAI

Mensagem do Gate News, 25 de abril — O DeepSeek lançou versões de prévia de V4-Pro e V4-Flash em 24 de abril, ambos modelos de pesos abertos com janelas de contexto de um milhão de tokens. O V4-Pro tem 1,6 trilhão de parâmetros no total, mas ativa apenas 49 bilhões por passagem de inferência usando uma arquitetura de Mixture-of-Experts. O V4-Flash tem 284 bilhões de parâmetros no total com 13 bilhões ativos.

Os preços são significativamente mais baixos do que os concorrentes: o V4-Pro custa US$ 1,74 por milhão de tokens de entrada e US$ 3,48 por milhão de tokens de saída—aproximadamente 98% menos do que o GPT-5.5 Pro da OpenAI ($30 input, $180 output) e cerca de um-vigésimo do custo do Claude Opus 4.7. O V4-Flash é precificado em US$ 0,14 de entrada e US$ 0,28 de saída por milhão de tokens. Ambos os modelos são open-source sob licença MIT e podem ser executados localmente gratuitamente.

O DeepSeek obteve ganhos de eficiência por meio de dois novos mecanismos de atenção: Compressed Sparse Attention e Heavily Compressed Attention, que reduzem os custos de computação para 27% do predecessor V4-Pro (V3.2) e 10% para o V4-Flash. A empresa treinou o V4 parcialmente em chips Huawei Ascend, contornando as restrições de exportação dos EUA a processadores Nvidia avançados. O DeepSeek afirmou que, uma vez que 950 novos supernós entrem em operação mais tarde em 2026, o preço cairá ainda mais.

Em benchmarks de desempenho, o V4-Pro-Max fica em primeiro lugar no Codeforces competitive programming (3.206 score, ficando em torno de 23º entre os competidores humanos) e obtendo 90,2% em problemas de matemática do Apex Shortlist versus 85,9% do Claude Opus 4.6. No entanto, fica para trás em benchmarks de multitarefa: MMLU-Pro (87,5% vs 91,0% do Gemini-3.1-Pro) e Humanity's Last Exam (37,7% vs 44,4%). Em tarefas de longo contexto, o V4-Pro lidera modelos open-source, mas perde para o Claude Opus 4.6 em testes de recuperação MRCR.

O V4-Pro introduz o "interleaved thinking," permitindo que fluxos de trabalho de agentes retenham contexto de raciocínio entre múltiplas chamadas de ferramentas sem descarregar entre as etapas. Ambos os modelos oferecem integrações de codificação com Claude Code e OpenCode. De acordo com a pesquisa com desenvolvedores do DeepSeek com 85 usuários, 52% disseram que o V4-Pro estava pronto como seu agente padrão de codificação, com 39% inclinados a adotar. Os endpoints antigos deepseek-chat e deepseek-reasoner serão descontinuados em 24 de julho de 2026.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários