2026-06-23 19:02:17
OpenAIのGPT-5.5-CyberはCyberGymベンチマークで85.6%を達成し、Anthropicの「Banned Mythos」モデルを上回りました
OpenAIは、自社のDaybreakサイバー防衛プログラムの一環として、6月22日にGPT-5.5-Cyberの完全ローンチを発表した。CyberGymベンチマーク――188のオープンソースプロジェクトから知られる1,507件のソフトウェア脆弱性を再現することをAIエージェントに課す――で、このモデルは85.6%を達成し、AnthropicのMythos 5(83.8%)およびClaude Opus 4.7(73.1%)を上回った。 このローンチは、AnthropicのMythos 5とFable 5が、6月12日に出された米政府の禁止令を受けてオフラインのままでいる状況で行われた。禁止令は国家安全保障上の懸念と、潜在的なジェイルブレイクのリスクを理由としている。これとは対照的に、GPT-5.5-Cyberは本人確認されたセキュリティ専門家にのみ提供され、国家サイバー・ディレクター室を含む連邦機関によって事前承認されている。OpenAIは、CrowdStrike、Cisco、Cloudflareなどのサイバーセキュリティ企業と提携し、同モデルをそれらのツールに統合している。