Mensaje de Gate News, 23 de abril — Tencent presentó y lanzó como código abierto una vista previa de Hunyuan Hy3, un modelo de lenguaje híbrido de mezcla de expertos (MoE) que incorpora la fusión entre pensamiento rápido y lento. El modelo consta de 295 mil millones de parámetros totales con 21 mil millones de parámetros activos, y admite una longitud máxima de contexto de 256K tokens.
La vista previa de Hy3 es el primer modelo entrenado después de la reestructuración de Hunyuan y el modelo más inteligente de Tencent hasta la fecha. La empresa informa mejoras sustanciales en el razonamiento complejo, el seguimiento de instrucciones, el aprendizaje en contexto, la generación de código, las capacidades agentivas y el rendimiento de inferencia. El científico jefe de IA, Yao Shunyu, afirmó que la vista previa de Hy3 marca el primer paso de la reconstrucción de Hunyuan y expresó la esperanza de que los comentarios de la comunidad de código abierto mejoren la utilidad práctica de la versión formal.
Tencent también está escalando de manera simultánea el entrenamiento previo y el aprendizaje por refuerzo para elevar el techo de inteligencia del modelo y colabora con múltiples productos de Tencent mediante un co-diseño profundo para mejorar el rendimiento en el mundo real. La empresa también está comenzando a explorar capacidades de modelos especializados.