Anthropic finalmente lançou a versão segura do modelo Mythos, Fable-5.


As informações sobre os parâmetros já foram bastante discutidas na internet, então não vou repetir.
O que vale mais a pena ver, na verdade, são os testes reais de tarefas feitos pela ferramenta de programação de terceiros Augment Code.
Este conjunto de testes executou um total de 489 tarefas de programação, e os resultados são bastante interessantes:
Fable-5 lidera claramente em desempenho geral e precisão.
Pontuação geral +0.224, precisão +0.191, de fato é a faixa mais forte até agora.
Mas outro detalhe também é muito importante: GPT-5.5 ainda supera com folga o Opus-4.8.
A pontuação geral do GPT-5.5 é +0.164, enquanto a do Opus-4.8 é +0.128;
a precisão do GPT-5.5 é +0.141, enquanto a do Opus-4.8 é +0.092.
Isso também explica a minha sensação recente: após o lançamento do Opus-4.8, não senti que ele fosse claramente mais forte que o GPT-5.5,
pelo menos em tarefas de programação reais, essa sensação não é uma ilusão.
O que é mais realista é a questão do custo.
Fable-5, embora forte, consome tokens e custos altos: cerca de 14,6 mil tokens por tarefa, custo de $3,09 por tarefa;
em comparação, GPT-5.5 usa 7,5 mil tokens, $1,52.
Ser forte é realmente forte, mas também é realmente caro.
Portanto, no final, ainda digo: espero que o GPT-5.6 chegue logo.
Se o Fable-5 só puder ser usado por 10 dias no plano de assinatura, e depois precisar ser chamado pelo preço original da API,
ele provavelmente não será uma ferramenta de produtividade diária para usuários comuns, mas sim um “modelo de luxo” para poucos, em poucos cenários.
O uso de modelos de IA pode realmente começar a dividir por classes.
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado