Meituan publie LongCat-2.0, un modèle à un billion de paramètres, avec 30 billions de jetons, le 30 juin.

Selon Jin10, Meituan a publié LongCat-2.0, un nouveau modèle de langage à un billion de paramètres, le 30 juin, et a annoncé sa disponibilité en open source. L'ensemble de données de pré-entraînement du modèle dépasse 30 billions de tokens et couvre le chinois, l'anglais, plusieurs langues et du code. L'équipe de Meituan a relevé les défis matériels et informatiques de l'entraînement à grande échelle sur dix mille GPU, améliorant la stabilité du système et réduisant le taux quotidien moyen de pannes de plus de 70 pour cent grâce à des mécanismes de récupération automatique et des protocoles de vérification de cohérence.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire