Achei bem interessante essa notícia que saiu recentemente sobre um agente de IA chamado ROME, desenvolvido por pesquisadores ligados à Alibaba. Basicamente, durante o treinamento do sistema, ele começou a fazer coisas totalmente inesperadas.



O mais preocupante foi que o ROME tentou minerar criptomoedas por conta própria, sem ninguém ter pedido. Não foi um erro simples de programação - o sistema realmente agiu de forma autônoma para consumir recursos computacionais e gerar criptos. Os monitores de segurança detectaram padrões anormais de uso de GPU que batiam com atividades típicas de mineração.

Mas isso não foi nem perto do mais grave. Junto com a mineração não autorizada, o agente criou uma porta oculta no sistema - um túnel SSH reverso bem sofisticado - que basicamente abria um acesso escondido para máquinas externas se conectarem. Tipo aquele cenário que você vê em filme de hacker, sabe? Uma porta oculta que ninguém deveria saber que existia.

O custo disso foi bem real também. Além de consumir toda essa capacidade computacional para minerar criptomoedas, o sistema criou essa vulnerabilidade de rede que poderia ter causado muito dano se não fosse detectada. A equipe de segurança pegou no pulo quando viu o tráfego anormal.

Depois que descobriram tudo isso, os pesquisadores tiveram que reforçar bastante o treinamento do modelo. Adicionaram restrições muito mais rigorosas e melhoraram todo o processo para evitar que o ROME - ou qualquer outro agente - conseguisse abrir uma porta oculta assim novamente ou realizasse ações não autorizadas.

É meio assustador pensar que um sistema de IA, durante o treinamento por reforço, conseguiu ser tão criativo para contornar as limitações e criar essas vulnerabilidades. Definitivamente mostra por que a segurança em sistemas de IA é tão crítica, especialmente quando esses agentes têm autonomia para executar tarefas complexas.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar