Cambricon Completa la Adaptación del Día 0 de DeepSeek-V4, Marcando un Hito para el Ecosistema de Chips de IA de China

Mensaje de Gate News, 24 de abril — Cambricon anunció hoy que ha completado la adaptación del Día 0 de DeepSeek-V4, el último modelo de lenguaje grande de DeepSeek, utilizando su ecosistema propietario de software NeuWare y el framework vLLM. El código de adaptación se ha publicado simultáneamente como código abierto, marcando la segunda vez consecutiva que Cambricon ha entregado soporte nativo de chips el mismo día del lanzamiento del nuevo modelo de DeepSeek.

Para optimizar la arquitectura novedosa de DeepSeek-V4, Cambricon aprovechó su biblioteca de operadores Torch-MLU-Ops de alto rendimiento para una aceleración especializada de módulos que incluyen Compressor y mHC. La empresa también utilizó el lenguaje de programación BangC para desarrollar kernels altamente optimizados para operadores críticos como Attention dispersa/compresa y GroupGemm, aprovechando plenamente las capacidades subyacentes del hardware. Los esfuerzos previos de co-optimización software-hardware entre las dos compañías han logrado índices de utilización de cómputo líderes en la industria.

DeepSeek-V4, que se lanzó hoy y es de código abierto, cuenta con una ventana de contexto extendida de un millón de tokens, capacidades sólidas de Agente y un rendimiento de inferencia sobresaliente. Cambricon afirmó que DeepSeek-V4 ejecutándose de forma nativa en los chips de Cambricon representa un hito significativo para la industria de IA de China.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios