Le GPT-5.5-Cyber d’OpenAI atteint 85,6 % sur le benchmark CyberGym et dépasse le modèle Banned Mythos d’Anthropic

OpenAI a annoncé le lancement complet de GPT-5.5-Cyber le 22 juin, dans le cadre de son programme de défense cyber Daybreak. Sur le benchmark CyberGym — qui teste des agents IA sur leur capacité à reproduire 1 507 vulnérabilités logicielles connues issues de 188 projets open source — le modèle a atteint 85,6 %, surpassant Mythos 5 d’Anthropic à 83,8 % et Claude Opus à 73,1 %.

Le lancement intervient alors que Mythos 5 et Fable 5 d’Anthropic restent hors ligne après une interdiction du gouvernement américain émise le 12 juin, invoquant des préoccupations de sécurité nationale et des risques potentiels de jailbreak. En revanche, GPT-5.5-Cyber est disponible uniquement pour les professionnels de la sécurité vérifiés et a été pré-approuvé par des agences fédérales, dont le Office of the National Cyber Director. OpenAI s’est associé à des entreprises de cybersécurité, notamment CrowdStrike, Cisco et Cloudflare, pour intégrer le modèle à leurs outils.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire