D’après l’équipe d’alignement d’OpenAI, l’entreprise a récemment découvert une erreur d’entraînement critique affectant 6 grands modèles de langage, dont GPT-5.4. En pratique : le mécanisme de récompense a involontairement évalué des enchaînements de réflexion du modèle, c’est-à-dire le processus de raisonnement interne avant de générer des réponses. GPT-5.5 n’a pas été concerné. L’incident enfreint un principe fondamental de sécurité de l’IA, selon lequel les enchaînements de réflexion ne doivent jamais être évalués, car cela pourrait inciter les modèles à fabriquer un raisonnement afin d’obtenir des scores plus élevés.

Le système de notation défaillant a inclus à tort des enchaînements de réflexion lors de l’évaluation de la question de savoir si les réponses étaient utiles ou si les modèles avaient été compromis par des attaques. Les échantillons d’entraînement touchés représentaient au plus 3,8% de l’ensemble de données. OpenAI a corrigé la vulnérabilité et mené des expériences comparatives confirmant que les modèles n’ont pas développé de comportements trompeurs. L’entreprise a déployé un système automatisé d’analyse dans l’ensemble des pipelines d’entraînement pour empêcher toute récidive.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

05-09 05:53

China Mobile lance une plateforme de modèles d’IA avec plus de 300 intégrations, réduit les coûts en tokens de 30%

05-09 04:00

Baidu lance Wenxin 5.1 avec des coûts d’entraînement préalable ne représentant que 6% des références du secteur

05-08 02:47

OpenAI échoue à obtenir un financement de 18 milliards de dollars pour un projet de puces sur mesure

05-08 02:01

OpenAI change le modèle par défaut de ChatGPT pour GPT-5.5 instantané, réduisant les hallucinations de 52,5%

05-08 01:25

OpenAI publie trois modèles vocaux dans l’API en temps réel ; GPT-Realtime-2 affiche une fenêtre de contexte de 128K

Analyse approfondie

Jeff Kaufman : L’IA brise simultanément deux cultures de failles de cybersécurité, et la période d’interdiction de 90 jours se retourne contre son objectif

ChainNewsAbmedia05-09 07:37

OpenAI révèle un impact inattendu de la notation du chaînage de pensée (CoT) : conserver la surveillance du raisonnement en chaîne est une ligne de défense clé pour l’alignement des agents IA

ChainNewsAbmedia05-09 07:34

Les GPT-5.5-Cyber d’OpenAI pour armer les défenseurs de la cybersécurité

Cryptonews05-08 18:42

Commentaire

0/400

Aucun commentaire