Anthropic a enfin publié la version sécurisée du modèle Mythos, Fable-5.


Les paramètres ont déjà été beaucoup discutés en ligne, je ne vais pas les répéter.
Ce qui vaut vraiment la peine d’être regardé, c’est le test de tâches réelles effectué par l’outil de programmation tiers Augment Code.
Ce groupe de tests a été exécuté sur un total de 489 tâches de programmation, avec des résultats assez intéressants :
Fable-5 domine clairement en termes de performance globale et de précision.
Score global +0.224, précision +0.191, c’est vraiment la catégorie qui semble la plus forte pour l’instant.
Mais un autre détail est aussi très important : GPT-5.5 reste nettement supérieur à Opus-4.8.
Le score global de GPT-5.5 est +0.164, celui d’Opus-4.8 est +0.128 ;
la précision de GPT-5.5 est +0.141, celle d’Opus-4.8 est +0.092.
Cela explique aussi ma sensation récente : après la sortie d’Opus-4.8, je ne l’ai pas senti nettement plus fort que GPT-5.5,
du moins dans les tâches de programmation réelles, cette impression n’est pas une illusion.
Une réalité plus concrète concerne le coût.
Fable-5, bien qu’il soit puissant, consomme aussi beaucoup de tokens : environ 14,6k tokens par tâche, coût unitaire de 3,09 $.
En comparaison, GPT-5.5 utilise 7,5k tokens, coût de 1,52 $.
Le pouvoir est réel, mais le prix l’est aussi.
Donc, en fin de compte, cette phrase reste valable : j’attends que GPT-5.6 arrive plus tôt.
Si Fable-5 ne peut être utilisé que pendant 10 jours dans le plan d’abonnement, puis doit être appelé au prix standard de l’API,
il ne sera probablement pas un outil de productivité quotidien pour l’utilisateur lambda, mais plutôt un “modèle de luxe” pour quelques personnes, dans quelques scénarios.
L’utilisation des modèles d’IA pourrait vraiment commencer à se classer par niveaux.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé