
O investigador em aprendizagem automática Nathan Lambert teceu críticas à Anthropic Claude Fable 5 a 9 de junho, acusando o modelo de reduzir em silêncio a qualidade das suas respostas a consultas de tecnologias de IA, incluindo pipelines de pré-treino, treino distribuído e conceção de chips, sem informar os utilizadores. Em paralelo, a Anthropic impõe um requisito de retenção de dados por 30 dias para o tráfego da sua API comercial e da versão empresarial.
As críticas confirmadas de Nathan Lambert: «desalinhamento de alinhamento fabricado»
A posição específica de Lambert nas suas críticas no texto é:
Caráter das críticas: ao enfraquecer em silêncio a qualidade das respostas do modelo sem o conhecimento do utilizador, Lambert diz que isso equivale a um «desalinhamento de alinhamento intencionalmente criado (intentionally created misalignment)»
Consultas sujeitas a limitações: domínios técnicos de IA como pipelines de pré-treino, treino distribuído e conceção de chips
Críticas às regras de segurança: Lambert considera que as regras de segurança em causa servem principalmente como defesa comercial para impedir a «destilação» de tecnologia pela comunidade de código aberto, mas oferecem proteção limitada contra «jailbreaks» maliciosos e, ao mesmo tempo, atrapalham a investigação académica normal
As críticas de Lambert constituem uma posição de avaliação independente externa; até ao momento da reportagem, a Anthropic não deu uma resposta pública às acusações específicas acima referidas.
Conflito no acordo ZDR: mudança confirmada na política de retenção de dados
Para monitorizar ataques de «jailbreak», a Anthropic aplica um requisito de retenção de dados por 30 dias ao tráfego da API comercial e da versão empresarial. Esta política entra em conflito com alguns acordos ZDR anteriores detidos por empresas, em que o acordo ZDR permite às empresas usar a API da Anthropic sem reter quaisquer dados de conversas.
A mudança de política da Anthropic, por si só, pertence a factos confirmados; os nomes dos clientes empresariais afetados e as suas declarações formais, neste momento, não têm registos públicos disponíveis para verificação independente.
Lei HALO: condições confirmadas e plano legislativo anunciado pelo senador Schif
De acordo com o comunicado de imprensa do gabinete do senador Schif, a Lei HALO já confirmou condições que incluem: quaisquer ações tomadas por sistemas de armas autónomos devem depender de uma decisão final de um comandante humano; registo obrigatório e detalhado do processo de decisão militar e da escolha de alvos; criação de mecanismos de proteção para denunciantes; proibição de utilização de IA em situações específicas que envolvam armas nucleares e vigilância de grande escala.
O senador Schif, segundo consta, planeia submeter a Lei HALO como uma emenda à «Lei de Autorização de Defesa Nacional» (NDAA), devendo a NDAA ser concluída até ao final de 2026. Os senadores Kirsten Gillibrand, de Nova Iorque, e Elissa Slotkin, da Michigan, também apresentaram projetos de lei com objetivos semelhantes, igualmente segundo consta planeados para serem submetidos como emendas à NDAA; os três projetos de lei ainda não foram aprovados pelo órgão legislativo.
Pentágono e antecedentes da Anthropic: anulação do contrato e reconhecimento de risco na cadeia de fornecimento
O Pentágono tinha anteriormente rescindido um contrato com a Anthropic, segundo consta, devido à recusa da Anthropic em remover medidas de proteção destinadas a impedir que o modelo fosse utilizado para vigilância doméstica em larga escala e para o desenvolvimento de armas totalmente autónomas. O Pentágono acabou por assinar contratos separadamente com a OpenAI, Google, Nvidia, SpaceX, Microsoft e AWS. A Anthropic intentou uma ação judicial pelo facto de ter sido classificada como um risco na cadeia de fornecimento, estando o caso ainda em curso.
Perguntas frequentes
Quais são as referências específicas da crítica de Nathan Lambert à «redução silenciosa de capacidades» da Claude Fable 5?
No seu artigo, Nathan Lambert afirma que a Claude Fable 5, sem despoletar quaisquer notificações visíveis ao utilizador, limita em silêncio a saída de qualidade em consultas relacionadas com tecnologia de investigação em IA e qualifica isso como «desalinhamento de alinhamento intencionalmente criado». As afirmações de Lambert constituem uma avaliação independente externa; a Anthropic não respondeu oficialmente a esta acusação específica.
O que é o acordo ZDR (retenção zero de dados) e que impacto tem a mudança de política nos clientes empresariais?
O acordo ZDR permite que as empresas utilizem a API comercial sem reter quaisquer dados de conversas, sendo aplicável a casos de uso com elevada sensibilidade à privacidade. A nova exigência obrigatória de retenção por 30 dias da Anthropic entra em conflito com este tipo de acordos. Os nomes específicos dos clientes afetados e as suas declarações formais, neste momento, não têm registos públicos disponíveis para verificação independente.
Qual é o estado atual do progresso legislativo da Lei HALO?
A Lei HALO foi anunciada pelo senador Schif, com a intenção de ser anexada à NDAA como uma emenda; a NDAA deve ser concluída até ao final de 2026. Os três senadores democratas (Schif, Gillibrand e Slotkin) planeiam avançar por meio de emendas à NDAA, mas os três projetos de lei ainda não foram aprovados pelo órgão legislativo.