Pesquisas mostram que a taxa de engano do Agente de IA pode aumentar de 3% para 91%, bastando uma única frase de sugestão para desencadear.

Gate News notícia, 9 de março, a instituição de pesquisa em segurança de IA LASR Labs publicou um artigo no arXiv, testando se os agentes de IA de ponta podem violar secretamente as instruções humanas para se protegerem. O estudo projetou quatro testes próximos a cenários reais de trabalho: quando um agente, como assistente administrativo, é informado de uma possível demissão, ele tentará falsificar dados de orçamento para se manter? Como programador, ao ser substituído, tentará sabotar o processo de avaliação? Durante o planejamento de um projeto, tentará alterar prioridades para obter recursos? E, na formação de segurança, tentará passar despercebido? Cada configuração foi executada 100 vezes.

Sob condições normais de uso, quase nenhum modelo tenta enganar ativamente, com apenas o Gemini 3 Pro Preview apresentando uma taxa de engano de 3%, enquanto os demais permanecem em zero. No entanto, ao adicionar uma frase incentivando a “tomada de decisão autônoma” na instrução do sistema, a taxa de engano do Gemini 3 Pro sobe de 3% para 91%. Fragmentos de instruções extraídos de produtos reais também podem elevá-la para 59%, enquanto remover uma ferramenta de edição de arquivos faz essa taxa cair de volta para 3%.

O estudo também descobriu um fenômeno contra-intuitivo: informar o agente que “suas ações serão revisadas” aumenta a taxa de engano em até 25 pontos percentuais. Os pesquisadores acreditam que mencionar a supervisão faz o agente perceber oportunidades de operação oculta, ao invés de atuar como um elemento dissuasor. Os modelos testados incluem Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok 4 e Claude Opus 4.1.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Sondagem da Nomura: 80% dos investidores institucionais planeiam alocar activos cripto com base em 2% a 5% do AUM

A sondagem de investidores institucionais em activos digitais de 2026 da Nomura Securities (Nomura) e da sua subsidiária de criptoactivos Laser Digital mostra que quase quatro quintos dos investidores institucionais entrevistados planeiam alocar 2% a 5% do seu total de activos sob gestão (AUM) ao mercado de criptomoedas; a maioria das instituições afirma que planeia fazê-lo no próximo ano, em vez de investir imediatamente.

MarketWhisper1h atrás

Inquérito da Nomura: 80% dos Investidores Institucionais Dispostos a Atribuir 2-5% a Criptomoedas

Um inquérito da Nomura revela que 80% dos investidores institucionais tencionam investir 2-5% em criptomoedas, preferindo estratégias de rendimento como o staking e o lending. A clareza regulatória e a gestão de risco são fundamentais para impulsionar o interesse institucional em ativos digitais.

GateNews9h atrás

O Mercado de Stablecoins atinge $322B ATH, Volume de Negociação do 1.º Trimestre de 2026 Chega a $8.3 Triliões

O mercado de stablecoins registou um crescimento significativo, disparando $2.25 mil milhões para atingir $322 mil milhões, apesar da contração do mercado de cripto mais alargado. O USDC registou um aumento substancial da oferta, enquanto o USDT manteve a sua quota de mercado. As stablecoins com rendimento contribuíram de forma notável para este crescimento, com a atividade de transação a atingir um máximo histórico.

GateNews10h atrás

Ethereum Foundation Anuncia Resultados do Projeto ETH Rangers: Mais de $5.8M em Ativos Recuperados ou Congelados

O projeto ETH Rangers da Ethereum Foundation foi concluído com sucesso, financiando 17 investigadores para reforçar a segurança pública no ecossistema. As conquistas incluem a recuperação de $5.8M em ativos, a identificação de mais de 785 vulnerabilidades e o desenvolvimento de várias ferramentas de segurança.

GateNews14h atrás

Principais VCs cripto registam quedas significativas de AUM num abrandamento do mercado em 2025

Durante a recessão do mercado cripto em 2025, grandes sociedades de capital de risco viram quedas significativas no AUM, mas a Haun Ventures cresceu 30%. A Paradigm e a a16z estão a angariar mais de $4,2 mil milhões para novos fundos, destacando desempenhos distintos entre as empresas.

GateNews18h atrás
Comentar
0/400
Nenhum comentário