Equipe de Shenzhen conclui o treinamento do modelo DeepSeek-V4-Pro com 1,6 trilhão de parâmetros no chip Ascend 910C desenvolvido localmente

De acordo com a Shenzhen Release, em 5 de junho, uma equipe de projeto da Shenzhen Hezhou Academy, em colaboração com o Harbin Institute of Technology (Shenzhen), Shenzhen Big Data Institute, Huawei e a plataforma de computação de IA da Deep Intelligence City, concluiu o pós-treinamento com parâmetros completos do modelo DeepSeek-V4-Pro, com 1,6 trilhão de parâmetros, usando o cluster doméstico de computação de IA Ascend 910C. Isso marca uma das primeiras vezes em que uma organização terceirizada conclui o treinamento de um modelo nesse nível de escala em uma plataforma de computação doméstica da China, demonstrando que chips de IA nacionais podem suportar o treinamento de modelos grandes de nível mundial.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários