La mini Max de Chine défie à nouveau la guerre générative mondiale avec le modèle IA 'M2.1'.

La start-up chinoise d'intelligence artificielle MiniMax a lancé un nouveau modèle d'IA, M2.1, défiant à nouveau la concurrence mondiale en matière d'IA générative. Ce modèle renforce de manière significative la diversité des langages de programmation et la capacité à répondre aux environnements de travail réels, montrant des performances globalement améliorées non seulement dans l'assistance à la programmation, mais aussi dans la rédaction de documents et les réponses aux dialogues.

La version M2.1 publiée améliore considérablement la compréhension et la précision de génération de divers langages de programmation grâce à une mise à niveau des performances par rapport au modèle précédent M2. Les langages pris en charge ont été étendus à Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript, etc. De plus, sa capacité à concevoir et à esthétiser les interfaces utilisateur sur les plateformes Web, Android et iOS a également reçu des évaluations significativement améliorées.

Il est particulièrement remarquable que M2.1 renforce non seulement la précision de l'exécution de codes simples, mais améliore également sa capacité à interpréter et à suivre des instructions de tâches complexes ou des directives détaillées, construisant ainsi une IA plus adaptée à un environnement de bureau réel. MiniMax a donc amélioré les capacités de dialogue et de rédaction de documents du modèle, indiquant qu'il montre des performances exceptionnelles dans une large gamme allant des conversations quotidiennes à la rédaction de documents techniques et aux réponses structurées.

Scott Breitenother, co-fondateur et PDG de la plateforme open source d'agents IA Kilo Code, a déclaré : « Lors des tests préliminaires, le M2.1 a montré des résultats exceptionnels dans l'ensemble du processus de développement, y compris la conception de l'architecture, l'orchestration du code, la révision et le déploiement », et a évalué que ce modèle répondait à la fois aux critères de rentabilité et de performance élevée.

Ce modèle est également évalué par un nouvel indicateur de référence appelé VIBE (Vision and Interactive Benchmark for Execution). VIBE est construit sur cinq domaines clés : Web, simulation, Android, iOS et développement backend, et il évalue la logique d'interaction et les éléments visuels des résultats générés à l'aide d'un langage de validation basé sur des agents. Selon MiniMax, le M2.1 a obtenu une note moyenne de 88,6 dans ce test de référence, avec des scores excellents de 91,5 et 89,7 respectivement dans les domaines Web et Android.

M2.1 a également été comparé en termes de performance avec des modèles d'IA de premier plan. Dans les résultats d'évaluation parallèles avec les principaux modèles des principaux fournisseurs tels qu'Anthropic, Google, OpenAI et DeepSeek, M2.1 a également démontré une forte capacité de résolution de problèmes dans des tests de référence difficiles tels que “Humanity's Last Exam” et “Toolathon”. En particulier, il a obtenu 22,0 points dans le projet HLE w/o Tools et 88 points dans le test d'évaluation globale MMLU(Pro) dans les domaines des sciences humaines, des sciences et de la technologie, se classant au même niveau que les meilleurs modèles d'IA.

M2.1 est actuellement disponible via l'API propriétaire de MiniMax ou Hugging Face, et les services de représentation de l'entreprise MiniMax sont également basés sur M2.1. Le lancement de ce modèle montre que le support de l'encodage multilingue et le marché des agents IA évoluent rapidement, et cela indique que l'universalité et la compétitivité de l'IA générative originaire de Chine continuent de se développer.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)