GLM-5.2 da Zhipu lidera modelos open-source no benchmark AA com 51 pontos, igualando o GPT-5.5 no teste GDPval

De acordo com o Beating AI monitoring, o mais recente modelo GLM-5.2 da Zhipu ocupa o primeiro lugar entre os modelos open-source no benchmark de inteligência v4.1 da Artificial Analysis, com uma pontuação de 51 pontos, ultrapassando o MiniMax-M3 (44 pontos) e o DeepSeek V4 Pro (44 pontos). No teste GDPval-AA v2, que simula trabalho real do conhecimento, o GLM-5.2 obteve 1.524 pontos (linha de base humana: 1.000), igualando o modelo de fronteira fechado GPT-5.5 no modo xhigh reasoning e superando o MiniMax-M3 (1.418 pontos) e o DeepSeek V4 Pro (1.328 pontos).

O modelo tem 744B de parâmetros totais com 40B de parâmetros ativos e alarga a janela de contexto de 200K para 1M tokens. O GLM-5.2 opera sob licença MIT e é disponibilizado em várias plataformas, incluindo a API oficial da Zhipu, SiliconFlow e DeepInfra, com um custo médio por tarefa de aproximadamente $0,46 por tarefa.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário