Mensaje de Gate News, 23 de abril — Tencent presentó y lanzó como código abierto una vista previa de Hunyuan Hy3, un modelo de lenguaje híbrido de mezcla de expertos (MoE) que incorpora la fusión entre pensamiento rápido y lento. El modelo consta de 295 mil millones de parámetros totales con 21 mil millones de parámetros activos, y admite una longitud máxima de contexto de 256K tokens. La vista previa de Hy3 es el primer modelo entrenado después de la reestructuración de Hunyuan y el modelo más inteligente de Tencent hasta la fecha. La empresa informa mejoras sustanciales en el razonamiento complejo, el seguimiento de instrucciones, el aprendizaje en contexto, la generación de código, las capacidades agentivas y el rendimiento de inferencia. El científico jefe de IA, Yao Shunyu, afirmó que la vista previa de Hy3 marca el primer paso de la reconstrucción de Hunyuan y expresó la esperanza de que los comentarios de la comunidad de código abierto mejoren la utilidad práctica de la versión formal.

Tencent también está escalando de manera simultánea el entrenamiento previo y el aprendizaje por refuerzo para elevar el techo de inteligencia del modelo y colabora con múltiples productos de Tencent mediante un co-diseño profundo para mejorar el rendimiento en el mundo real. La empresa también está comenzando a explorar capacidades de modelos especializados.

Ver fuente

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.

Noticias relacionadas

04-23 04:54

Perplexity 披露网络搜索代理的后训练方法；基于 Qwen3.5 的模型在准确率与成本上优于 GPT-5.4

04-23 02:22

Australia colabora con Anthropic para abordar los riesgos de ciberseguridad de la IA Mythos

04-22 14:05

Yifan Zhang divulga las especificaciones técnicas completas de DeepSeek V4: 1.6T parámetros, 384 expertos con 6 activaciones

04-22 11:21

Cambricon expresa optimismo sobre el objetivo de ingresos de 10.000 millones de yuanes ante el auge de la demanda de chips de IA

04-22 08:25

Google Research publica ReasoningBank: los agentes de IA aprenden estrategias de razonamiento del éxito y del fracaso

Análisis en profundidad

¡Banca en Taiwán y el sector financiero se unen para crear una IA local! El modelo de lenguaje financiero a gran escala se pondrá en línea a más tardar a finales de año.

ChainNewsAbmedia04-23 06:54

Moomoo? CISO? Alerta: ShinyHunters afirma haber comprometido los sistemas internos de Anthropic

Market Whisper04-23 03:31

¡Llega ChatGPT Images 2.0! La precisión de generación de texto ha mejorado enormemente; crea fácilmente carteles de marketing

ChainNewsAbmedia04-22 04:24

Comentar

0/400

Sin comentarios