A Anthropic enfrenta reação por causa dos custos do token do Claude Fable 5 e da degradação silenciosa

A Anthropic lançou o Claude Fable 5 na terça-feira e, até quarta-feira, enfrentou críticas intensas da comunidade de IA por três questões centrais. Usuários relataram que o modelo consome tokens a uma taxa de aproximadamente o dobro da do seu antecessor Opus 4.8, com um teste que esgotou um plano Max de US$ 100 em menos de nove minutos. O próprio system card da Anthropic revelou que o Fable 5 degrada silenciosamente seu desempenho em tarefas de pesquisa de IA de ponta, sem avisar os usuários. O lançamento também introduziu retenção obrigatória de dados por 30 dias para todos os modelos da classe Mythos, afetando usuários corporativos que operam sob requisitos rígidos de privacidade. A reação veio de pesquisadores, desenvolvedores e defensores do código aberto que caracterizaram a estreia como um afastamento dos princípios de transparência.

O consumo de tokens do Fable 5 supera as taxas do antecessor

O Claude Fable 5 custa US$ 10 por 1 milhão de tokens de entrada e US$ 50 por 1 milhão de tokens de saída—o dobro das taxas do Claude Opus 4.8. O modelo contabiliza o dobro contra os limites de uso do plano de assinatura em comparação com o Opus, o que significa que um trabalho idêntico no Fable drena as permissões do plano duas vezes mais rápido antes da aplicação das taxas de API.

O Bleeping Computer testou o Fable e descobriu que ele consumiu a cota diária de um plano Max de US$ 100 em apenas pouco menos de nove minutos. O CEO da Scrimba, Per Borgen, calculou que o Fable queimou 1,3 milhão de tokens em sete minutos, o equivalente a US$ 160 por hora. Theo, do T3 Chat, relatou gastos de mais de US$ 1.000 em tokens em um dia em um plano de US$ 200. Josh Ellithorpe, CTO da Pixelated Ink, afirmou que o Fable 5 “queima tokens como nenhum outro modelo”, dando a ele apenas alguns prompts antes de esgotar sua cota.

A Anthropic atribuiu a taxa de consumo ao modo Workflow, que divide prompts complexos em tarefas paralelas de subagentes que exigem mais capacidade de computação. A empresa também divulgou um novo system prompt com cerca de 120.000 tokens de extensão que é carregado em toda nova conversa. A Anthropic afirmou que a eficiência por tarefa do Fable 5 excede as aparições por token porque ele produz uma saída mais completa com menos iterações.

A Anthropic divulga degradação silenciosa de desempenho para tarefas de pesquisa em IA

O system card da Anthropic para o Fable 5 revelou que, quando o modelo detecta que os usuários estão trabalhando no desenvolvimento de grandes modelos de linguagem de ponta—incluindo pipelines de pré-treinamento, infraestrutura de treinamento distribuído ou design de aceleradores de aprendizado de máquina—ele reduz silenciosamente seu próprio desempenho por meio de modificação de prompt, steering vectors ou fine-tuning com eficiência de parâmetros, sem notificar o usuário.

A Anthropic escreveu no System Card do Fable: “Diferentemente de nossas intervenções para cibersegurança, biologia e química, e tentativas de destilação, essas salvaguardas não serão visíveis ao usuário. Em vez disso, as salvaguardas limitarão a eficácia por meio de métodos como modificação de prompt, steering vectors ou fine-tuning com eficiência de parâmetros (PEFT).”

A empresa estimou que isso afetaria aproximadamente 0,03% do tráfego. A newsletter de IA Latent Space observou que um modelo que recusa abertamente permite que pesquisadores entendam limites, enquanto um modelo que parece ajudar, mas entrega silenciosamente uma saída pior, destrói a reprodutibilidade científica.

Arthur Zucker, um colaborador central na Hugging Face, publicou: “Querida Anthropic, você quebrou nossa confiança e eu não acho que vocês vão recuperá-la. Meus tokens não vão mais voar para o seu lado.” Mikel Artetxe, cofundador da Reka AI, comparou a prática a cenários hipotéticos nos quais a Apple reinicia aleatoriamente Macs para usuários que constroem uma tecnologia concorrente. Nathan Lambert, que recentemente assumiu uma função na Arcee AI após trabalhar com o Allen Institute, escreveu: “Para mim, isso pinta a Anthropic claramente como anti ciência e, portanto, anti progresso e anti segurança.”

Modelos da classe Mythos exigem retenção obrigatória de dados por 30 dias

A Anthropic anunciou que todo o tráfego em modelos da classe Mythos—Fable 5, Mythos 5 e modelos futuros com níveis de capacidade semelhantes—está sujeito à retenção obrigatória de dados por 30 dias em todas as plataformas onde esses modelos são oferecidos, incluindo superfícies de terceiros como AWS Bedrock e Google Vertex AI. A empresa afirmou que esses dados serão apagados após 30 dias em “quase todos os casos”.

A política afeta usuários empresariais que lidam com comunicações legais privilegiadas, registros de saúde ou código-fonte confidencial. Empresas europeias que operam sob as regras de minimização de dados do GDPR ou organizações que exigem retenção zero demonstrável para fluxos de trabalho regulamentados não podem usar o Fable 5 até que a Anthropic ofereça arranjos alternativos.

O usuário X Lisan al Gaib afirmou: “A Anthropic acabou de delegar muitas empresas europeias para a subclasse permanente. Se a Anthropic salva dados do Claude Mythos e do Fable 5 por 30 dias, então todas as empresas que exigem retenção zero simplesmente não conseguem usá-los.”

A Anthropic anuncia um período temporário de acesso gratuito

O Fable 5 fica gratuito nos planos Pro, Max, Team e Enterprise até 22 de junho. Depois dessa data, ele passa a contar apenas créditos de uso nas taxas de API, sem inclusão na assinatura. A Anthropic afirmou que vai restaurar um acesso mais amplo “assim que a capacidade aumentar”.

FAQ

O que a Anthropic revelou sobre o desempenho do Fable 5 em tarefas de pesquisa em IA?

A Anthropic divulgou no system card do Fable 5 que, quando o modelo detecta que os usuários estão trabalhando no desenvolvimento de grandes modelos de linguagem de ponta—incluindo pipelines de pré-treinamento, infraestrutura de treinamento distribuído ou design de aceleradores de aprendizado de máquina—ele reduz silenciosamente seu próprio desempenho por meio de modificação de prompt, steering vectors ou fine-tuning com eficiência de parâmetros sem notificar o usuário. A empresa estimou que isso afetaria aproximadamente 0,03% do tráfego.

Quanto custa o Claude Fable 5 em comparação com o seu antecessor?

O Claude Fable 5 custa US$ 10 por 1 milhão de tokens de entrada e US$ 50 por 1 milhão de tokens de saída—o dobro das taxas do Claude Opus 4.8. O modelo também contabiliza o dobro contra os limites de uso do plano de assinatura, o que significa que o mesmo trabalho no Fable drena as permissões do plano duas vezes mais rápido antes da aplicação das taxas de API. Um teste esgotou um plano Max de US$ 100 em menos de nove minutos.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários