A Tencent Lança e Disponibiliza como Código Aberto uma Pré-visualização de Hunyuan Hy3 com 295B Parâmetros

Mensagem de Gate News, 23 de Abril — A Tencent lançou e disponibilizou como código aberto uma pré-visualização de Hunyuan Hy3, um modelo híbrido de linguagem com mistura de especialistas, que combina pensamento rápido e lento. O modelo tem 295 mil milhões de parâmetros no total, com 21 mil milhões de parâmetros ativos, suportando um comprimento máximo de contexto de 256K tokens. A pré-visualização Hy3 é o primeiro modelo treinado após a reestruturação do Hunyuan e o modelo mais inteligente da Tencent até à data. A empresa afirma melhorias significativas em raciocínio complexo, seguimento de instruções, aprendizagem em contexto, geração de código, capacidades agentic e desempenho na inferência. O Cientista-Chefe de IA Yao Shunyu declarou que a pré-visualização Hy3 marca o primeiro passo da reconstrução do Hunyuan e expressou a esperança de que o feedback da comunidade de código aberto aumente a utilidade prática da versão formal.

A Tencent está simultaneamente a ampliar o pré-treino e a aprendizagem por reforço para elevar o teto de inteligência do modelo e a colaborar com múltiplos produtos da Tencent através de um co-design profundo, a fim de melhorar o desempenho no mundo real. A empresa está também a começar a explorar capacidades de modelos especializados.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário