La série MiMo-V2.5 de Xiaomi passe en open source : 1 000 milliards de paramètres avec une efficacité en jetons supérieure à GPT-5.4

Message de Gate News, le 27 avril — L’équipe MiMo de Xiaomi a publié en open source la série de modèles de langage MiMo-V2.5 sous licence MIT, prenant en charge le déploiement commercial, l’entraînement continu et l’affinage. Les deux modèles présentent une fenêtre de contexte de 1 million de jetons. MiMo-V2.5-Pro est un modèle mélange d’experts pure-texte (MoE) avec 1,02 trillion de paramètres au total et 42 milliards de paramètres actifs, tandis que MiMo-V2.5 est un modèle natif multimodal avec 310 milliards de paramètres au total et 15 milliards de paramètres actifs, prenant en charge la compréhension du texte, de l’image, de la vidéo et de l’audio.

MiMo-V2.5-Pro vise des tâches d’agents complexes et de programmation. Sur les benchmarks ClawEval, il a obtenu 64% de Pass@3 tout en consommant environ 70 000 jetons par trajectoire de tâche — 40% à 60% de jetons en moins que Claude Opus, Gemini 3.1 Pro et GPT-5.4. Le modèle a obtenu 78,9 sur SWE-bench Verified. Lors d’une démonstration, V2.5-Pro a implémenté indépendamment un compilateur complet SysY-to-RISC-V pour un projet de cours du compilateur de l’Université de Pékin en 4,3 heures avec 672 appels d’outils, atteignant un score parfait de 233/233 sur des jeux de tests cachés.

MiMo-V2.5 est conçu pour des scénarios d’agents multimodaux, doté d’un encodeur visuel dédié (729 millions de paramètres) et d’un encodeur audio (261 millions de paramètres), obtenant 62,3 sur le sous-ensemble général Claw-Eval. Les deux modèles emploient une architecture hybride combinant l’attention à fenêtre glissante (SWA) et l’attention globale (GA), associée à un module de prédiction multi-jetons à 3 couches (MTP) pour une inférence accélérée. Les poids du modèle sont disponibles sur Hugging Face.

En plus de la publication open source, l’équipe MiMo a lancé le « Orbit Quadrillion Token Creator Incentive Program », offrant 100 quadrillions de jetons gratuitement sur 30 jours aux utilisateurs du monde entier. Les développeurs individuels, les équipes et les entreprises peuvent postuler via la page du programme, avec un cycle d’évaluation d’environ 3 jours ouvrés ; les avantages approuvés sont distribués sous forme de Token Plans ou de crédits directs, compatibles avec des outils comme Claude Code et Cursor.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Time Magazine classe 10 des entreprises d’IA les plus influentes ; ByteDance, Zhipu, Alibaba figurent parmi les meilleurs choix

Message de Gate News, 28 avril — Time Magazine a dévoilé sa liste des « 10 entreprises d’IA les plus influentes en 2026 », en mettant l’accent sur un impact global sur l’industrie, les trajectoires technologiques et la société plutôt que de se concentrer uniquement sur les capacités du modèle. Les entreprises sélectionnées sont ByteDance, Amazon,

GateNewsIl y a 8m

Le Comité central de Chine lance une initiative globale « AI+ » pour développer une économie intelligente

Message de Gate News, 28 avril — Le Bureau politique du Comité central du Parti communiste chinois a tenu une réunion le 28 avril pour analyser la situation économique actuelle et planifier les travaux. La réunion a souligné la nécessité de mettre en œuvre de manière exhaustive

GateNewsIl y a 35m

Tencent Cloud améliore les capacités de son Agent d’entreprise et lance plusieurs produits d’IA

Message des Gate News, 28 avril — Tencent Cloud a annoncé une mise à niveau complète de ses capacités de produit Agent d’entreprise, de bout en bout, au sommet 2026 Tencent Cloud City à Chongqing le 28 avril. L’entreprise a dévoilé plusieurs nouveaux produits, dont l’édition édition cloud privé ClawPro, ADP

GateNewsIl y a 1h

Microsoft et OpenAI renouvellent leur accord : suppression de l’exclusivité, retrait des clauses relatives à l’AGI

Selon l’annonce du 27 avril publiée sur le blog officiel de Microsoft, Microsoft et OpenAI ont officiellement annoncé la reconduction de leur accord de partenariat ; trois changements majeurs : suppression de l’exclusivité d’OpenAI envers le cloud Microsoft, abrogation de la clause la plus controversée « clause déclenchant l’atteinte de l’AGI » du passé, et prolongation de la licence IP jusqu’en 2032 mais désormais sous une forme non exclusive. Pour l’industrie de l’IA, il s’agit d’un moment clé dans la restructuration structurelle de la relation entre les deux parties, depuis qu’OpenAI a accepté le premier investissement de Microsoft en 2019. Fin de l’exclusivité : OpenAI peut choisir n’importe quel service cloud Dans le cadre du nouvel accord, OpenAI n’est plus contraint d’être limité à Microsoft

ChainNewsAbmediaIl y a 1h

Le PDG de CleanSpark met en garde contre une hausse des coûts de 20x en convertissant les mines de Bitcoin en centres de données d’IA

Message de Gate News, 28 avril — Le PDG de CleanSpark, Matt Schultz, a averti lors de la conférence Bitcoin 2026 que la conversion des opérations d’extraction de bitcoin en centres de données d’IA augmente considérablement les coûts d’infrastructure. Le coût de construction par mégawatt grimpe d’environ 500 000 $ à 10–12 millions $, une

GateNewsIl y a 1h

Cadence relève ses prévisions de chiffre d'affaires 2026 à 6,13-6,23 Md$ grâce à la demande de puces d'IA

Message de Gate News, 28 avril — Cadence Design Systems, un éditeur de logiciels de conception de puces basé en Californie, a relevé, le 27 avril, ses prévisions de chiffre d'affaires pour l'exercice 2026, invoquant une forte demande pour des outils servant à concevoir des processeurs d'IA et des puces plus complexes. La société s'attend désormais à un chiffre d'affaires de $6.13

GateNewsIl y a 1h
Commentaire
0/400
Aucun commentaire