Cambricon finalise l’adaptation Day 0 de DeepSeek-V4, une étape majeure pour l’écosystème de puces IA de la Chine

Message de Gate News, 24 avril — Cambricon a annoncé aujourd’hui avoir achevé l’adaptation Day 0 de DeepSeek-V4, le dernier grand modèle de langage de DeepSeek, en utilisant son écosystème logiciel propriétaire NeuWare et le framework vLLM. Le code d’adaptation a été open-sourcé simultanément, marquant le deuxième lancement consécutif où Cambricon fournit une prise en charge native de puces le jour de la sortie du nouveau modèle de DeepSeek.

Pour optimiser la nouvelle architecture de DeepSeek-V4, Cambricon a tiré parti de sa bibliothèque d’opérateurs Torch-MLU-Ops hautes performances pour une accélération spécialisée de modules, notamment Compressor et mHC. L’entreprise a également utilisé le langage de programmation BangC pour développer des kernels hautement optimisés pour des opérateurs critiques tels que l’Attention clairsemée/compressée et GroupGemm, en exploitant pleinement les capacités sous-jacentes du matériel. Les efforts précédents de co-optimisation logiciel-matériel entre les deux entreprises ont permis d’atteindre des taux d’utilisation du calcul parmi les plus élevés de l’industrie.

DeepSeek-V4, lancé aujourd’hui et open-source, propose une fenêtre de contexte étendue d’un million de tokens, de solides capacités d’Agent et des performances d’inférence exceptionnelles. Cambricon a déclaré que DeepSeek-V4, fonctionnant nativement sur des puces Cambricon, représente une étape importante pour l’industrie IA chinoise.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Cursor révèle les raisons derrière l’entraînement de XAI : la puissance de calcul est bloquée, SpaceX détient séparément une option d’achat de 60 milliards de dollars

Anysphere annonce que Cursor s’entraînera avec xAI en utilisant l’infrastructure Colossus pour entraîner de nouveaux modèles afin de dépasser le goulot de la puissance de calcul ; SpaceX a proposé une option d’acquisition de 60 milliards de dollars (acquisition globale possible avant 2026), sinon il paiera environ 10 milliards de dollars en guise d’indemnité de compensation pour la coopération. Les deux transactions sont menées en parallèle, redéfinissant qui peut entraîner Cursor et qui peut racheter Cursor ; Cursor autorise toujours de nombreux backends de modèles, mais l’évolution à long terme dépend de la décision de SpaceX d’exercer son droit d’acquisition.

ChainNewsAbmediaIl y a 9m

Évaluation du marché secondaire d’Anthropic dépasse 1 billion de dollars : Forge Global dépasse OpenAI de 880 milliards

Selon le rapport de Decrypt, l’évaluation secondaire d’Anthropic de Forge Global est d’environ 1 000 milliards de dollars, celle d’OpenAI d’environ 880 milliards de dollars, et le marché secondaire affiche pour la première fois une inversion de tendance en tête. Le revenu annuel récurrent (ARR) d’Anthropic est passé d’environ 9 milliards à la fin de 2025 à environ 30 milliards en mars 2026, une croissance de 233 % sur trois mois, qui fait grimper la valorisation en capital-investissement. Les valorisations secondaires diffèrent des financements de première ronde, reflétant la confiance dans les sorties ; à l’avenir, l’on continue de regarder quatre axes : la technologie, la politique, le business et le récit.

ChainNewsAbmediaIl y a 10m

Meta Platforms prévoit une réduction de 10 % de ses effectifs le 20 mai, affectant environ 8 000 postes

Message d’actualité Gate News, 24 avril — Meta Platforms prévoit de réduire ses effectifs d’environ 10 %, touchant environ 8 000 postes, le 20 mai. Les licenciements visent à améliorer l’efficacité opérationnelle tout en augmentant les investissements dans l’intelligence artificielle. La restructuration prévue reflète le

GateNewsIl y a 1h

Le gouvernement Trump publie un plan visant à lutter contre le raffinage de l’IA, accusant des entreprises chinoises de voler systématiquement les capacités des modèles

Le conseiller du président pour la politique technologique au sein du Bureau de la politique technologique de la Maison-Blanche (OSTP), Michael J. Kratsios, a publié le 23 avril une déclaration officielle indiquant que l’administration Trump dispose d’informations montrant que des entités étrangères (principalement basées en Chine) visent délibérément de grandes entreprises américaines d’intelligence artificielle, en extrayant systématiquement les capacités des modèles d’IA américains via « des dizaines de milliers de comptes d’agents » et des systèmes de jailbreak, tout en annonçant simultanément quatre mesures de riposte.

MarketWhisperIl y a 1h

DeepSeek lance une version d’aperçu open source V4, avec une note technique de 3206 dépassant GPT-5.4

DeepSeek a officiellement lancé le 24 avril une série de préversion de V4, sous licence MIT et publiée en open source, avec des poids de modèle mis en ligne sur Hugging Face et ModelScope. D’après le rapport technique de DeepSeek V4, V4-Pro-Max (mode avec le plus haut niveau de puissance d’inférence) a obtenu 3206 points sur le benchmark Codeforces, dépassant GPT-5.4.

MarketWhisperIl y a 1h

Tencent lance Hy3 en version d’aperçu open source, les tests de référence du code améliorent de 40 % par rapport à l’ancienne version

Tencent a officiellement publié en open source le modèle de langage de grande taille Hy3 (version d’aperçu) sur GitHub, Hugging Face et ModelScope le 23 avril, et a également proposé un service d’API payant via le cloud de Tencent (Tencent Cloud). D’après un rapport de Decrypt daté du 24 avril, la version d’aperçu de Hy3 a été lancée pour l’entraînement à la fin du mois de janvier et, au moment de la date de publication, moins de trois mois s’étaient écoulés.

MarketWhisperIl y a 2h
Commentaire
0/400
Aucun commentaire