2026-04-08 10:41:05

Récemment, j'ai réalisé une compétition entre plusieurs modèles, et j'ai fait une découverte assez intéressante.

Pour un même sujet d'architecture, j'ai demandé à Claude et Codex d'écrire chacun une solution indépendamment.
Codex a manqué une chose : ma stratégie est répartie dans plus de 20 processus indépendants, et sa proposition supposait que "tous les composants tournent au même endroit", ce qui est évidemment invalide. Claude a immédiatement repéré ce problème.
Inversement, Claude a manqué une autre chose : il était trop concentré sur la création de modules indépendants, alors qu'en réalité, je disposais déjà d'un cadre complet prêt à l'emploi, il suffisait d'ajouter un champ. Codex a rattrapé cette erreur.
Ce qui est le plus intéressant, c'est la dernière étape : j'ai demandé aux deux modèles de revoir la solution finale de l'autre. Tous deux ont inconsciemment supposé que "l'autre a déjà écrit le cadre", ce qui leur a fait manquer un cas limite — c'est finalement moi qui ai découvert cela en exécutant manuellement les données de production.
Donc, la nouvelle habitude est : à chaque round de compétition, définir des critères de succès indépendants, et interdire à un modèle de voir le brouillon de l'autre. On obtient ainsi deux brouillons indépendants, sans zones d'ombre communes, qui, combinés, se rapprochent d'une solution complète.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

2 J'aime