Tencent lanza y abre código de la vista previa de Hunyuan Hy3 con 295B de parámetros

Mensaje de Gate News, 23 de abril — Tencent presentó y lanzó como código abierto una vista previa de Hunyuan Hy3, un modelo de lenguaje híbrido de mezcla de expertos (MoE) que incorpora la fusión entre pensamiento rápido y lento. El modelo consta de 295 mil millones de parámetros totales con 21 mil millones de parámetros activos, y admite una longitud máxima de contexto de 256K tokens. La vista previa de Hy3 es el primer modelo entrenado después de la reestructuración de Hunyuan y el modelo más inteligente de Tencent hasta la fecha. La empresa informa mejoras sustanciales en el razonamiento complejo, el seguimiento de instrucciones, el aprendizaje en contexto, la generación de código, las capacidades agentivas y el rendimiento de inferencia. El científico jefe de IA, Yao Shunyu, afirmó que la vista previa de Hy3 marca el primer paso de la reconstrucción de Hunyuan y expresó la esperanza de que los comentarios de la comunidad de código abierto mejoren la utilidad práctica de la versión formal.

Tencent también está escalando de manera simultánea el entrenamiento previo y el aprendizaje por refuerzo para elevar el techo de inteligencia del modelo y colabora con múltiples productos de Tencent mediante un co-diseño profundo para mejorar el rendimiento en el mundo real. La empresa también está comenzando a explorar capacidades de modelos especializados.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios