Mensagem do Gate News, 24 de abril — A Cambricon anunciou hoje que concluiu a adaptação do Day 0 do DeepSeek-V4, o mais recente modelo de linguagem grande da DeepSeek, usando seu ecossistema proprietário de software NeuWare e a estrutura vLLM. O código de adaptação foi disponibilizado simultaneamente como open source, marcando a segunda vez consecutiva que a Cambricon entregou suporte nativo de chip no dia do lançamento do novo modelo da DeepSeek.
Para otimizar a arquitetura inédita do DeepSeek-V4, a Cambricon aproveitou sua biblioteca de operadores Torch-MLU-Ops de alto desempenho para aceleração especializada de módulos incluindo Compressor e mHC. A empresa também usou a linguagem de programação BangC para desenvolver kernels altamente otimizados para operadores críticos como Attention esparsa/comprimida e GroupGemm, aproveitando totalmente as capacidades subjacentes do hardware. Esforços anteriores de co-otimização software-hardware entre as duas empresas alcançaram taxas de utilização de computação líderes do setor.
O DeepSeek-V4, que foi lançado hoje e é open source, apresenta uma janela de contexto estendida de um milhão de tokens, fortes capacidades de Agent e excelente desempenho de inferência. A Cambricon afirmou que o DeepSeek-V4 executando nativamente nos chips da Cambricon representa um marco significativo para a indústria de IA da China.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
A Cursor revela as razões do treinamento de XAI: o poder de computação ficou travado, e a SpaceX, por sua vez, detém opções de compra no valor de 60 bilhões de dólares
A Anysphere anunciou que o Cursor irá, com a xAI, usar a infraestrutura Colossus para treinar novos modelos e superar a limitação de capacidade de computação; a SpaceX propôs uma opção de aquisição de US$ 60 bilhões (aquisição total dentro de 2026), e, caso não dê certo, pagará aproximadamente US$ 10 bilhões como compensação de colaboração. As duas transações ocorrem ao mesmo tempo, remodelando quem pode treinar o Cursor e quem pode comprar o Cursor; o Cursor ainda permite muitos backends de modelos, mas, a longo prazo, o caminho depende de a SpaceX exercer o direito de aquisição.
ChainNewsAbmedia9m atrás
Avaliação no mercado secundário da Anthropic ultrapassa 1 trilhão de dólares: Forge Global supera a OpenAI em 880 bilhões
De acordo com a reportagem da Decrypt, a avaliação secundária da Anthropic da Forge Global é de cerca de 1 trilhão de dólares; a da OpenAI é de aproximadamente 8.800 bilhões de dólares, com uma reversão de liderança pela primeira vez no mercado secundário. O ARR da Anthropic passou de cerca de 9,0 bilhões no fim de 2025 para aproximadamente 30 bilhões em março de 2026; em três meses, cresceu 233%, elevando a avaliação privada. As avaliações no mercado secundário são diferentes dos financiamentos na rodada primária, refletindo a confiança na saída; no futuro, ainda se espera que quatro frentes — tecnologia, políticas, negócios e narrativa — continuem em foco.
ChainNewsAbmedia10m atrás
Meta Platforms Planeja Redução de 10% da Força de Trabalho em 20 de Maio, Afetando Aproximadamente 8.000 Posições
Mensagem do Gate News, 24 de abril — A Meta Platforms planeja reduzir sua força de trabalho em aproximadamente 10%, afetando cerca de 8.000 vagas, em 20 de maio. Os desligamentos têm a intenção de melhorar a eficiência operacional enquanto aumentam os investimentos em inteligência artificial.
A reorganização planejada reflete a
GateNews1h atrás
O governo Trump divulgou um plano de combate ao reprocessamento de IA e acusou empresas chinesas de roubo sistemático de capacidades de modelos
Escritório de Políticas de Tecnologia da Casa Branca (OSTP), o Assistente do Presidente Michael J. Kratsios em 23 de abril divulgou um comunicado oficial, afirmando que o governo Trump tem informações que mostram que entidades estrangeiras (principalmente sediadas na China) estão deliberadamente mirando grandes empresas de IA dos EUA, extraindo sistematicamente a capacidade dos modelos de IA americanos por meio de “dezenas de milhares de contas de agentes” e sistemas de tecnologia de jailbreak, além de divulgar simultaneamente quatro medidas de resposta.
MarketWhisper1h atrás
DeepSeek lança uma versão de pré-visualização open source do V4, pontuação técnica 3206 superando o GPT-5.4
DeepSeek lançou oficialmente a série de pré-visualização V4 em 24 de abril, sob uma licença MIT de código aberto, com os pesos do modelo também disponíveis no Hugging Face e no ModelScope. De acordo com o relatório técnico do DeepSeek V4, o V4-Pro-Max (modo de força máxima de inferência) obteve 3206 pontos no benchmark do Codeforces, superando o GPT-5.4.
MarketWhisper1h atrás
A prévia do Hy3 open source da Tencent melhora em 40% os testes de benchmark de código em relação à versão anterior
A Tencent lançou oficialmente o modelo de linguagem grande Hy3 em versão de prévia no GitHub, no Hugging Face e na plataforma ModelScope em 23 de abril, e também disponibilizou simultaneamente um serviço de API pago no Tencent Cloud. De acordo com uma reportagem da Decrypt em 24 de abril, a versão de prévia do Hy3 iniciou o treinamento no final de janeiro e, até a data de publicação, havia menos de três meses.
MarketWhisper2h atrás