OpenAIのGPT-5.5-CyberはCyberGymベンチマークで85.6%を達成し、Anthropicの「Banned Mythos」モデルを上回りました

OpenAIは、自社のDaybreakサイバー防衛プログラムの一環として、6月22日にGPT-5.5-Cyberの完全ローンチを発表した。CyberGymベンチマーク――188のオープンソースプロジェクトから知られる1,507件のソフトウェア脆弱性を再現することをAIエージェントに課す――で、このモデルは85.6%を達成し、AnthropicのMythos 5(83.8%)およびClaude Opus 4.7(73.1%)を上回った。

このローンチは、AnthropicのMythos 5とFable 5が、6月12日に出された米政府の禁止令を受けてオフラインのままでいる状況で行われた。禁止令は国家安全保障上の懸念と、潜在的なジェイルブレイクのリスクを理由としている。これとは対照的に、GPT-5.5-Cyberは本人確認されたセキュリティ専門家にのみ提供され、国家サイバー・ディレクター室を含む連邦機関によって事前承認されている。OpenAIは、CrowdStrike、Cisco、Cloudflareなどのサイバーセキュリティ企業と提携し、同モデルをそれらのツールに統合している。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし