Récemment, j'ai réalisé une compétition entre plusieurs modèles, et j'ai fait une découverte assez intéressante.


Pour un même sujet d'architecture, j'ai demandé à Claude et Codex d'écrire chacun une solution indépendamment.
Codex a manqué une chose : ma stratégie est répartie dans plus de 20 processus indépendants, et sa proposition supposait que "tous les composants tournent au même endroit", ce qui est évidemment invalide. Claude a immédiatement repéré ce problème.
Inversement, Claude a manqué une autre chose : il était trop concentré sur la création de modules indépendants, alors qu'en réalité, je disposais déjà d'un cadre complet prêt à l'emploi, il suffisait d'ajouter un champ. Codex a rattrapé cette erreur.
Ce qui est le plus intéressant, c'est la dernière étape : j'ai demandé aux deux modèles de revoir la solution finale de l'autre. Tous deux ont inconsciemment supposé que "l'autre a déjà écrit le cadre", ce qui leur a fait manquer un cas limite — c'est finalement moi qui ai découvert cela en exécutant manuellement les données de production.
Donc, la nouvelle habitude est : à chaque round de compétition, définir des critères de succès indépendants, et interdire à un modèle de voir le brouillon de l'autre. On obtient ainsi deux brouillons indépendants, sans zones d'ombre communes, qui, combinés, se rapprochent d'une solution complète.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler