GLM-5.1 atinge o topo do ranking de código do LMArena: 1.º lugar em open source e 3.º a nível global

Notícias do Gate News, a 10 de abril. Hoje, a plataforma global de avaliação de IA de referência LMArena (plataforma de avaliação de modelos de IA com testes cegos, com participação de milhões de utilizadores) atualizou a tabela de classificação especializada do Code Arena: o GLM-5.1 ficou em primeiro lugar entre os modelos abertos a nível mundial, e em terceiro lugar na classificação global de modelos.

O GLM-5.1 não só herdou as capacidades de codificação em código aberto SOTA da geração anterior, como também alcançou um avanço nas tarefas de longo alcance (Long-Horizon Task), realizando: a construção, do zero, de um ambiente de trabalho Linux em 8 horas; 655 iterações para ultrapassar o gargalo de otimização de uma base de dados vetoriais; e 1000 rondas de chamadas a ferramentas para otimizar a carga de modelos de aprendizagem automática reais.

A destacar ainda que, sob critérios de avaliação equivalentes na tabela METR, o GLM-5.1 é o único modelo aberto a atingir trabalho contínuo ao nível de 8 horas, e é também um dos poucos modelos no mundo, para além do Claude Opus 4.6, com esta capacidade.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A CoreWeave garante um acordo de $6 mil milhões para a computação em nuvem de IA com a Jane Street

A CoreWeave garantiu um acordo de $6 mil milhões com a Jane Street para serviços de cloud de IA, que inclui um investimento de $1 mil milhões em acções da CoreWeave. A transição para infraestruturas de cloud de IA posicionou a CoreWeave como líder no sector.

GateNews1h atrás

A Google lança o Gemini 3.1 Flash TTS: suporta 70 línguas e cenários para encenação, voz de IA mais natural

A Google AI anunciou o lançamento do Gemini 3.1 Flash TTS, um modelo de texto-para-voz com suporte para 70 línguas, com novas funcionalidades como realizador de cenários, controlo ao nível do locutor e etiquetas de áudio. Em comparação com a geração anterior, o Gemini 3.1 melhora a naturalidade e a expressividade da voz, e pode ser utilizado através do Google AI Studio ou da Gemini API, sendo adequado a vários cenários de aplicação.

ChainNewsAbmedia2h atrás

DownDetector relata utilizadores do Claude a enfrentarem problemas no serviço

Mensagem de notícias da Gate, 15 de Abril — DownDetector, um website de monitorização do estado da rede, registou relatos de utilizadores que indicam que o Claude, um assistente de IA, está a enfrentar problemas de serviço.

GateNews11h atrás

Allbirds Levanta $50M através de Obrigações Conversíveis, faz a transição para Infraestrutura de IA como NewBird AI

Allbirds angariou $50 milhões através de obrigações conversíveis e irá passar do retalho de calçado para a computação em IA, rebatizando-se como NewBird AI para refletir a sua nova missão.

GateNews12h atrás

A OpenAI Planeia Novos Preços para os Anúncios do ChatGPT, Explorando Mais Atualizações

Mensagem de Notícias da Gate, 15 de Abril — A OpenAI está a planear introduzir novos preços para os anúncios do ChatGPT e a explorar outras opções de atualização, de acordo com o The Information.

GateNews13h atrás

A Startup de IA Hilbert Angaria $28M numa Série A Liderada pela Andreessen Horowitz

A Hilbert, uma startup de IA, angariou $28 milhões numa ronda de Série A liderada pela Andreessen Horowitz para ajudar as empresas a automatizar decisões para impulsionar o crescimento e a melhorar a eficácia dos seus investimentos em IA.

GateNews13h atrás
Comentar
0/400
Nenhum comentário