OpenAIは、審査済みのサイバー防御担当者向けにGPT-5.5-Cyberをリリースし、専門的なセキュリティ業務フローに合わせてガードレールを緩和した。
概要
- OpenAIのGPT-5.5-Cyberは、そのラインナップの中で最も許容度が高いモデルで、承認されたパートナーが先進的なセキュリティ業務に取り組むための限定プレビューとして提供されている。
- 審査済みのチームは、バグハンティング、マルウェア分析、リバースエンジニアリングにこれを使えるが、マルウェアの作成や資格情報の窃取は引き続きブロックされる。
- その発表は、ライバルのAnthropicによるClaude Mythos Previewのロールアウトが1か月前に行われたことに続くもので、投資家と政府の関心を集めた。
OpenAIは5月7日にGPT-5.5-Cyberを限定プレビューとしてリリースし、重要インフラを防御するセキュリティ専門家を対象にした。同社はこれを、サイバーセキュリティ・ラインナップの中で最も許容度が高いモデルとしており、強い検証要件とアカウント単位の統制を備えた承認済みパートナーの小規模グループ向けの、専門化された許可制ワークフローを想定している。
サイバー専用のバージョンにより、審査済みのチームは、脆弱性の特定、パッチの妥当性確認、マルウェア分析といった目的でOpenAIの最新モデルを使いやすくなる。一般提供されているGPT-5.5に組み込まれたガードレールが、これらの業務フローに摩擦を生むはずだった。
OpenAIは次のように述べた。「GPT-5.5-Cyberは、専門的なアクセス行動が重要になり得る先進的な業務フローを、小規模な一団のパートナーが学べるようにする。」
防御側ができること/できないこと
OpenAIのTrusted Access for Cyberプログラムの最上位ティアに承認された防御側は、公開モデルよりもガードレールが少ないGPT-5.5の版を受け取る。これにより、攻撃のバグハンティング、マルウェア研究、リバースエンジニアリングが可能になり、資格情報の窃取やマルウェアの作成は、アクセスのレベルにかかわらずブロックされたままとなる。
初期のテストでは、選抜されたパートナーがGPT-5.5-Cyberを使って、インフラ・システムでのレッドチーミング演習を自動化し拡大し、高い重大度の脆弱性を検証した。OpenAIは、責任ある開示プロセスの一環として、将来の技術的な深掘り記事でその調査結果を文書化する計画だ。
英国のAI Security Instituteは、95の狭いサイバー課題にわたるGPT-5.5の評価を公表した。同研究所は、基本的なタスクは少なくとも2026年2月以降、主要モデルによって完全に飽和されていることを見出した。一方で、能動的な防御側とアラート時のペナルティを伴う、十分に防御された現実のターゲットに対する性能を反映していないと注意している。
競争圧力
このロールアウトは、AnthropicがClaude Mythos Previewをリリースしてから1か月後のことだ。このサイバーに特化したモデルは、Anthropicがその2週間前にペンタゴンからブラックリスト入りしていたにもかかわらず、投資家とトランプ政権の上級メンバーの関心を引いた。
AIサイバーセキュリティは正式な競争領域になっており、両社は、AIの攻撃・防御ツールを誰が管理しているのか、またそれらの能力が悪用された場合に誰が責任を負うのかについて疑問を投げかけている。
OpenAIは、独立評価のために、米国のCenter for AI Standards and Innovationおよび英国のAI Security Instituteに対して、以前のモデルであるGPT-5.4-Cyberへのアクセスも提供していると述べた。標準のGPT-5.5は、多くの防御側にとって推奨される導入ポイントのままだ。