L’équipe de Shenzhen termine l’entraînement du modèle DeepSeek-V4-Pro à 1,6 billion de paramètres sur sa puce Ascend 910C développée en interne

D’après la publication de Shenzhen, le 5 juin, une équipe de projet de l’académie Shenzhen Hezhou, en collaboration avec le Harbin Institute of Technology (Shenzhen), le Shenzhen Big Data Institute, Huawei et la plateforme de calcul d’IA de Deep Intelligence City, a achevé un post-entraînement complet des paramètres du modèle DeepSeek-V4-Pro à 1,6 billion de paramètres, en utilisant le cluster de calcul d’IA national Ascend 910C. Cela constitue l’une des premières occurrences où une organisation tierce a complété l’entraînement du modèle à cette échelle sur une plateforme de calcul domestique chinoise, démontrant que les puces d’IA nationales peuvent prendre en charge l’entraînement de modèles de grande taille de niveau mondial.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire