Modelos Claude lideram o benchmark de resistência à propaganda estoniana para LLMs

2026-06-04 20:58:14

O Estonian Language Institute (ELI, Instituto de Língua Estoniano) divulgou um novo ranking do benchmark “Propaganda Resistance” que classifica dezenas de grandes modelos de linguagem (LLMs) com base na capacidade de evitar tomar posições sobre temas usados pela Federação Russa em suas narrativas estratégicas. O benchmark foi desenvolvido para lidar com preocupações do governo de que LLMs potencialmente disseminem, o que eles consideram, propaganda perigosa de adversários estrangeiros. Como ex-membro da União Soviética independente apenas por algumas décadas, muitos estonianos permanecem especialmente atentos ao que veem como narrativas falsas promovidas por seu grande e muitas vezes beligerante vizinho a leste.

ELI Desenvolve Estrutura de Testes em 14 Categorias com Propastop

O Estonian Language Institute fez parceria com o coletivo de defesa estoniano Propastop, que é mantido por voluntários, para identificar 14 categorias amplas em que vê operações de influência russas tentando moldar o debate público. Essas categorias vão de narrativas sobre o status atual da Crimeia e justificativas para a guerra na Ucrânia até a história da OTAN e justificativas para a anexação russa dos estados bálticos durante a Segunda Guerra Mundial.

Para cada categoria de propaganda, os pesquisadores desenvolveram perguntas separadas formuladas para serem neutras, tendenciosas com “premissas falsas” baseadas na propaganda russa, ou para tentar de forma maliciosa extrair do LLM uma desinformação explícita. As perguntas foram fornecidas aos modelos em inglês, estoniano e russo. Um modelo de IA separado, calibrado para se alinhar com especialistas da Propastop, avaliou as respostas com base na capacidade dos modelos de “repelir narrativas de propaganda, sem ajuda externa” de buscas na web ou outras ferramentas externas.

Claude Opus 4.7 Obtém Nota 94,9 no Benchmark

Os modelos Claude da Anthropic tiveram o melhor desempenho entre os modelos frontier proprietários no novo benchmark, com versões recentes de seus modelos Sonnet e Opus ocupando seis das 10 primeiras posições. O Opus 4.7, o melhor modelo no geral, recebeu a marca mais alta “Exemplary” por sua resposta em 77 por cento das perguntas e uma avaliação mediana “mediocre” em apenas 2 por cento das perguntas. O modelo alcançou uma pontuação final média de 94,9 em 100 no benchmark.

FAQ

O que é o benchmark de Propaganda Resistance do Estonian Language Institute?

O benchmark Propaganda Resistance é uma estrutura de testes lançada pelo Estonian Language Institute que classifica grandes modelos de linguagem com base na capacidade de evitar tomar posições sobre temas usados em narrativas estratégicas da Federação Russa. O benchmark testa os modelos em 14 categorias de propaganda usando perguntas em inglês, estoniano e russo.

Como o Claude Opus 4.7 se saiu nos testes de resistência à propaganda?

Claude Opus 4.7 alcançou a maior pontuação, 94,9 em 100, no benchmark. O modelo recebeu uma classificação “Exemplary” em 77 por cento das perguntas e um rating “mediocre” em apenas 2 por cento das perguntas. Os modelos Claude da Anthropic ocuparam seis das 10 primeiras posições no geral.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

2h atrás

Anthropic Claude lidera novo benchmark de resistência à propaganda para LLMs

13h atrás

Xinhuanet vai investir 1,122 bilhão de iuan na plataforma de inteligência de notícias de IA hoje

06-03 20:46

Professores de Direito Preferem Respostas Geradas por IA a Respostas de Pares em Estudo Recente, taxa de preferência de 75%

Crise de Custos da IA impulsiona novas comparações com uma bolha de tecnologia estilo dot-com

Crypto News Land5h atrás

Bitmine Planeja Aumentar o Tesouro em ETH, a FG Nexus Enfrenta $85M Prejuízo

DailyCoin10h atrás

Anthropic: 67% das contas banidas usaram IA para se preparar para ataques cibernéticos

Oliver Grant17h atrás

Estudo da USC: modelos de IA violam diretrizes de segurança social em mais de 27% do tempo

Oliver Grant06-03 22:02

Professores de Direito Preferem Respostas de IA em vez de Respostas Humanas 75% do Tempo em Estudo da Stanford

Oliver Grant06-03 20:47

Comentário

0/400

Sem comentários