China Mini Max, desafía nuevamente la guerra generativa global con el modelo de IA 'M2.1'

La startup china de inteligencia artificial MiniMax ha lanzado un nuevo modelo de IA M2.1, desafiando una vez más a la competencia global en IA generativa. Este modelo refuerza significativamente la diversidad de lenguajes de programación y la capacidad de respuesta en entornos de trabajo reales, mostrando una mejora integral no solo en la asistencia de código, sino también en la redacción de documentos y en las respuestas de diálogo.

La M2.1 lanzada esta vez ha mejorado significativamente la comprensión y precisión de generación de varios lenguajes de programación mediante una actualización de rendimiento que supera al modelo anterior M2. Los lenguajes soportados se han ampliado a Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript, entre otros, y su capacidad de diseño estético y de interfaz de usuario en plataformas Web, Android e iOS también ha recibido una evaluación notablemente mejorada.

Lo que es especialmente destacado es que M2.1 no solo refuerza la corrección de la ejecución de código simple, sino que también ha mejorado su capacidad para interpretar y seguir instrucciones complejas o guías detalladas, construyendo así una IA que se adapta mejor al entorno de trabajo real. MiniMax ha mejorado la capacidad de diálogo y la capacidad de redacción de documentos del modelo, y ha demostrado un rendimiento excepcional en un amplio rango que abarca desde diálogos cotidianos hasta la redacción de documentos técnicos y respuestas estructuradas.

El cofundador y CEO de Kilo Code, una plataforma de código abierto de IA, Scott Breitenother, dijo: “En las pruebas iniciales, M2.1 ha demostrado resultados excepcionales en todo el proceso de desarrollo, incluida la arquitectura, la orquestación de código, la revisión y el despliegue”, y evaluó que el modelo cumple con la relación costo-beneficio y un alto nivel de rendimiento.

Este modelo también es evaluado mediante un nuevo indicador de referencia llamado VIBE (Vision and Interactive Benchmark for Execution). VIBE se basa en cinco áreas clave: Web, simulación, Android, iOS y desarrollo backend, y realiza un juicio integral de la lógica de interacción y los elementos visuales de los resultados generados a través de un lenguaje de verificación basado en agentes. Según MiniMax, M2.1 obtuvo una puntuación promedio de 88.6 en esta prueba de referencia, logrando calificaciones sobresalientes de 91.5 y 89.7 en las áreas de Web y Android, respectivamente.

M2.1 también se comparó en rendimiento con los principales modelos de IA. En los resultados de la evaluación en paralelo con los modelos principales de fabricantes como Anthropic, Google, OpenAI, DeepSeek, M2.1 también mostró una poderosa capacidad de resolución de problemas en pruebas de referencia difíciles como “Humanity's Last Exam” y “Toolathon”. Especialmente, logró 22.0 puntos en el proyecto HLE w/o Tools y 88 puntos en la prueba integral MMLU(Pro) en los campos de humanidades, ciencias y tecnología, compitiendo con los mejores modelos de IA.

M2.1 actualmente se puede descargar a través de la API propia de MiniMax o Hugging Face, y el servicio de representantes de la empresa para el agente MiniMax también se basa en M2.1. Esta publicación del modelo muestra que el soporte de codificación multilingüe y el mercado de agentes de IA están evolucionando rápidamente, lo que también sugiere que la versatilidad y competitividad de la IA generativa originaria de China están en continua expansión.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt