
Andrej Karpathy, cofundador da OpenAI, que no mês passado se juntou à Anthropic, compartilhou em 9 de junho sua avaliação sobre o Claude Fable 5, dizendo que ele traz uma virada de desempenho com significado entre gerações, e descrevendo seu impacto na produtividade com a metáfora de que “softwares como se fossem água da torneira passam a jorrar sem parar”. No entanto, Karpathy alertou de forma explícita para que jamais se abra mão da revisão de código.
Avaliação do poder de “confirmação” de Karpathy sobre o Fable 5
Salto de desempenho entre gerações: Karpathy confirmou que o Fable 5 atingiu um salto de desempenho entre gerações; sua vantagem é especialmente evidente ao lidar com tarefas mais longas, permitindo executar instruções complexas com quase nenhuma intervenção humana.
Depuração de cadeias longas e complexas: Karpathy apontou que o Fable 5, ao enfrentar objetivos ambiciosos de desenvolvimento, consegue captar rapidamente a intenção e avançar de forma autônoma, algo que foi a primeira vez que ele sentiu um impulso forte de querer trabalhar sem olhar o código.
Aviso claro (palavras originais de Karpathy): Ele enfatizou que não se deve pular completamente a revisão de código em ambientes de produção; este é o alerta direto dele aos usuários.
Explicação do modelo subjacente (confirmada por Karpathy): Karpathy afirmou que o Claude Fable 5 e o Claude Mythos 5 compartilham o mesmo modelo subjacente, e que o Fable 5 adiciona, sobre essa base, medidas extras de segurança.
Paradoxo de Jevons: a estrutura de análise de Karpathy
Ao comentar, Karpathy observou que, quando o software disponível passa a surgir sem parar, como se fosse água corrente, o “Paradoxo de Jevons” da área de software (Jevons Paradox) é acionado.
Definição do Paradoxo de Jevons: quando a eficiência do uso dos recursos melhora drasticamente, o custo de uso cai de forma significativa; por isso, a demanda total por esse recurso cresce ao invés de diminuir, de maneira exponencial.
Análise de aplicação de Karpathy (a partir dos comentários no seu X): ele disse que esse efeito levará as pessoas a criarem uma enorme quantidade de ferramentas de uso único “hiper-específicas” (hyper-specific) e também de vastos conjuntos de testes, impulsionando no fim o crescimento exponencial da demanda geral por software.
Questões de confirmação sobre mecanismos de segurança
Karpathy afirmou em seus comentários que, no início do lançamento, a configuração dos mecanismos de segurança do Claude Fable 5 ainda está sensível demais, exigindo otimização posterior. Essa avaliação coincide com o que a Anthropic declarou em seu comunicado de lançamento do Fable 5: a Anthropic reconheceu que, às vezes, as medidas de segurança geram falsos positivos em solicitações inofensivas (taxa de acionamento geral abaixo de 5%) e disse que está trabalhando para melhorar e reduzir esses falsos positivos o quanto antes.
Perguntas frequentes
O que o “Paradoxo de Jevons” citado por Karpathy significa na geração de código por IA?
Com base nos comentários de Karpathy no X, quando a IA faz com que o custo de produção de software chegue próximo de zero, a demanda por software não diminui; ao contrário, cresce de forma exponencial. Ele prevê que isso incentivará os desenvolvedores a criarem mais ferramentas de uso único altamente customizadas e grandes conjuntos de testes, ampliando o consumo geral de software.
Por que Karpathy alertou de forma clara para não pular completamente a revisão de código em ambientes de produção?
Karpathy disse que, embora as capacidades do Fable 5 tenham sido a primeira vez que ele sentiu vontade de não olhar o código, ele ainda alertou explicitamente que essa prática não deve ser aplicada em ambientes de produção. O alerta dele está alinhado com a recomendação oficial da Anthropic — mesmo com saídas de modelos poderosos, é necessário supervisão humana para garantir confiabilidade.
Qual é a visão específica de Karpathy sobre os mecanismos de segurança do Fable 5?
Nos comentários, Karpathy apontou que, no início do lançamento, a configuração dos mecanismos de segurança do Fable 5 está sensível demais e precisa de otimização futura. No comunicado oficial, a Anthropic também confirmou que, no momento, as medidas de segurança às vezes geram falsos positivos para solicitações inofensivas, com taxa de acionamento abaixo de 5%, e disse que está em andamento para melhorar continuamente.