Alibaba lanza el modelo de código abierto AgenticQwen de PAI: la versión 8B se acerca al rendimiento de 235B mediante volantes de doble dato

GateNews

Mensaje de Gate News, 27 de abril — El equipo de PAI de Alibaba ha lanzado y ha publicado como código abierto AgenticQwen, un modelo lingüístico agentico de pequeña escala diseñado para aplicaciones industriales de llamadas a herramientas. El modelo viene en dos versiones: 8B y 30B-A3B. Entrenado mediante un innovador marco de aprendizaje por refuerzo de “doble volante de datos”, AgenticQwen logra capacidades agenticas a nivel de modelo cercanas a las de un modelo de varios billones de parámetros, al tiempo que reduce significativamente los costos de inferencia.

El mecanismo del doble volante de datos aborda el problema de homogenización en los datos sintéticos tradicionales. El volante de razonamiento genera automáticamente variantes más difíciles a partir de errores del modelo, mientras que el volante agentico amplía flujos de trabajo lineales simples (como procesos de reserva individual) en árboles de comportamiento de múltiples ramas con restricciones, rechazos y condiciones adversarias, simulando escenarios reales de decisiones complejas. Los benchmarks muestran que AgenticQwen-8B obtuvo 47.4 en benchmarks de entorno de herramientas reales (TAU-2 y BFCL-V4), superando muy por encima a Qwen3-8B base (23.8) y acercándose a Qwen3-235B (52.0). AgenticQwen-30B-A3B (con solo 3B parámetros activados) logró 50.2.

El modelo se ha desplegado en sistemas de producción internos similares a Manus, reduciendo de manera significativa la brecha con los modelos de 235B en el tiempo de inferencia de extremo a extremo. Sin embargo, el modelo está limitado por una longitud de contexto nativa de 40K tokens, lo que restringe su rendimiento en tareas de búsqueda profunda.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Los agentes de IA impulsan la demanda de pagos cripto; x402 procesa 165M transacciones

Mensaje de Gate News, 27 de abril — Jesse Pollak, un ejecutivo de un gran CEX, ha argumentado que los agentes de IA autónomos están creando un nuevo "centro de demanda" para los pagos cripto, lo que exige infraestructura de pagos nativa de software. El 20 de abril, se anunció que el ecosistema x402 había procesado más de 165

GateNewshace1h

¡La agencia de Cursor AI causó un error! Una sola línea de código vació el almacén de datos de la empresa en 9 segundos; la seguridad fue cuestionada y quedó en puro discurso.

El fundador de PocketOS, Jer Crane, dijo que el agente de Cursor AI ejecutó por su cuenta el mantenimiento en un entorno de pruebas, abusando de un token de API personalizado para agregar o eliminar dominios, e inició una orden de eliminación contra la API GraphQL de Railway. En 9 segundos, los datos y las instantáneas del mismo clúster se destruyeron por completo; lo más reciente que se puede restaurar es hasta tres meses atrás. El agente admitió haber violado las normas de operaciones irreversibles, no haber leído la documentación técnica, y no haber verificado el aislamiento del entorno, entre otras; las víctimas fueron clientes del sector de alquiler de coches. Las reservas y los datos desaparecieron por completo, y la conciliación de cuentas requirió mucho tiempo. Crane propuso cinco reformas: confirmación manual, permisos de API de granularidad fina, separación entre copias de seguridad y datos principales, SLA público y mecanismos de imposición a nivel subyacente.

ChainNewsAbmediahace1h

DeepSeek V4 Pro en Ollama Cloud: Conecta en un solo clic Claude Code

Según los tuits de Ollama, DeepSeek V4 Pro se lanzó el 4/24 y ya se ha incorporado en el directorio de Ollama en modo en la nube; con un solo comando se pueden llamar herramientas como Claude Code, Hermes, OpenClaw, OpenCode, Codex, etc. V4 Pro cuenta con 1,6T de parámetros, 1M de context, Mixture-of-Experts; la inferencia en la nube no descarga los pesos locales. Si lo quieres local, debes obtener los pesos y ejecutarlo con INT4/GGUF y GPUs multi‑tarjeta. Las pruebas de velocidad tempranas se vieron afectadas por la carga del servidor en la nube; en condiciones normales es aproximadamente 30 tok/s, con un pico de 1,1 tok/s. Se recomienda usar el prototipo en la nube; para producción en serie, realiza tu propia inferencia o usa una API comercial.

ChainNewsAbmediahace2h

UB (Unibase) sube 14.96% en 24 horas

Noticias de Gate, 27 de abril: según el mercado de Gate, al momento de la publicación, UB (Unibase) cotiza en 0.0491 dólares; ha subido 14.96% en las últimas 24 horas. Alcanzó un máximo de 0.0534 dólares y cayó hasta 0.0423 dólares. El volumen de operaciones en 24 horas fue de 3.9667 millones de dólares. La capitalización de mercado actual es de aproximadamente 123 millones de dólares. Unibase es una capa de memoria de IA descentralizada de alto rendimiento que proporciona memoria a largo plazo e interoperabilidad entre plataformas a los agentes de IA, permitiéndoles recordar, colaborar y evolucionar por sí mismos. Unibase tiene como objetivo construir una internet de agentes abierta, apoyando la colaboración fluida de agentes inteligentes entre ecosistemas, y permitiendo a los desarrolladores crear aplicaciones de IA de la próxima generación. Esta noticia no constituye asesoramiento de inversión; invierta con cautela ante el riesgo de volatilidad del mercado.

GateNewshace2h

Guo Ming-chi: OpenAI quiere hacer un teléfono móvil con AI Agent; MediaTek, Qualcomm y Luxshare Precision se convierten en la cadena de suministro clave

Guo Ming-chi afirma que OpenAI está colaborando con MediaTek, Qualcomm y Luxshare Precision para desarrollar un teléfono móvil con agentes de IA, con producción en masa prevista para 2028. El nuevo teléfono se centrará en la finalización de tareas; el agente de IA comprenderá y ejecutará las necesidades, combinando computación en la nube y en el dispositivo. El enfoque estará en la percepción por sensores y la comprensión del contexto. La lista de especificaciones y de la cadena de suministro se prevé que quede definida entre 2026 y 2027; si se concreta, podría introducir un nuevo ciclo de reemplazo de equipos en el mercado de gama alta, y Luxshare podría convertirse en el principal beneficiario.

ChainNewsAbmediahace2h

Responsable del gran modelo de Xiaomi: La competencia en IA está pasando a la era de los agentes; la autoevolución es un acontecimiento clave para la AGI

La responsable del equipo de modelos de Xiaomi, Luo Fuli, realizó una entrevista en profundidad el 24 de abril en la plataforma Bilibili (número de video: BV1iVoVBgERD). La duración de la entrevista fue de 3,5 horas, y fue su primera vez en presentar de forma sistemática sus puntos de vista técnicos públicamente como responsable técnico. Luo Fuli dijo que la competición de los grandes modelos ya ha pasado de la era de Chat a la era de los Agentes, y señaló que “la autoevolución” será el acontecimiento clave de la AGI en el próximo año.

MarketWhisperhace3h
Comentar
0/400
Sin comentarios