Huawei Ascend 910C termine un post-apprentissage avec paramètres complets pour DeepSeek-V4-Pro avec 1,6 billion de paramètres

D’après le gouvernement de Shenzhen, le 5 juin, une équipe de recherche comprenant Huawei Technologies a achevé un post-entraînement complet à paramètres pour DeepSeek-V4-Pro en utilisant les puces Ascend 910C de l’entreprise. Le projet a fait tourner le plus grand modèle de DeepSeek à ce jour, avec 1,6 billion de paramètres, sur un cluster alimenté par plus de 1 000 puces Huawei. L’équipe comprenait Huawei, le Shenzhen Loop Area Institute, le campus de Shenzhen de la Harbin Institute of Technology et le Shenzhen Research Institute of Big Data. Cela marque une étape dans les efforts de la Chine pour passer de l’inférence IA à l’entraînement de modèles en s’appuyant sur du matériel national, dans le contexte des restrictions d’exportation américaines.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire