Anthropic Claude lidera novo benchmark de resistência à propaganda para LLMs

De acordo com o Instituto da Língua da Estônia, a organização patrocinada pelo governo divulgou recentemente um novo ranking do benchmark “Propaganda Resistance”, que classifica dezenas de grandes modelos de linguagem com base na capacidade de evitar tomar posições sobre narrativas estratégicas russas. Os modelos da Anthropic Claude tiveram o melhor desempenho entre os modelos de fronteira, com o Claude Opus 4.7 obtendo 94,9 de 100 e recebendo a classificação “Exemplar” em 77% das questões de teste. O benchmark avaliou respostas de LLM em 14 categorias de operações russas de influência, cobrindo temas que vão do status da Crimeia até a história da OTAN.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários