OpenAIは2026年4月23日に、ネイティブなコンピュータ利用能力を通じて現実世界のアプリケーションにおけるユーザーの意図を理解するよう設計された新しいAIモデル「GPT-5.5」を公式にリリースしました。OpenAIの発表によると、このモデルは汎用のネイティブ機能を備えており、デスクトップアプリケーションをナビゲートし、ボタンをクリックし、複数ステップのワークフローに対してテキストを入力できます。
GPT-5.5は、ネイティブなコンピュータ利用と高度な推論を組み合わせ、上級のプロフェッショナル作業に必要なソフトウェアツールを自律的にナビゲートします。モデルの約110万トークンのコンテキストウィンドウにより、これまで手作業でのチャンク分割が必要だった巨大な金融データセットを処理できます。OpenAIの金融チームはGPT-5.5を使って24,771のK-1税務フォーム (71,637ページ) をレビューし、前年度より2週間早くタスクを完了しました。
GPT-5.5は、社内の投資銀行モデリング業務で88.5%、FinancialAgent v1.1ベンチマークで60%を獲得し、GPT-5.4を4ポイント上回りました。このモデルはGDPvalで84.9%を達成しました。これは44の職業にまたがる特定の知識労働をエージェントが生み出す能力をテストするものです。OSWorld-Verified(モデルの自律的な実コンピュータ操作を測定)では、78.7%に到達しました。GPT-5.5は、非常に難しいカスタマーサービスのワークフローをテストするTau2-bench Telecomで98%を獲得しました。
Go-to-Marketチームの従業員は、週次のビジネスレポートを自動化すれば、毎週の手作業が約5〜10時間削減されると確認しました。
OpenAIは、GPT-5.5が自社のサービング基盤向けのコードを書くのを支援するために使用されたと報告しています。このモデルは、生産トラフィックのパターンを分析してカスタムの負荷分散ヒューリスティックを書き、自己の「システムレベル最適化」を達成しました。それにより、自己のトークン生成速度が20%向上しました。
開発者テストでは、モデルに「マークダウンエディタを再設計(リ-アーキテクト)せよ」と依頼し、最小限の人間による修正で、ほぼ完成した12-diffのスタックを返しました。OpenAIは、新しいモデルはより少ないターンで正しい答えに到達し、GPT-5.4と比べて同じCodexのタスクで40%少ないトークンを使用すると述べています。
Everyの創業者兼CEOであるDan Shipperは、GPT-5.5を「深刻な概念的明晰さ」を備えた最初のコーディングモデルだと説明しました。Shipperは、彼自身と最も優秀なエンジニアが、リリース後の問題のデバッグに数日費やした後、GPT-5.5をテストしました。Shipperによれば、GPT-5.5はGPT-5.4ではできなかったことを達成しました。つまり、壊れたコードを調べて、エンジニアが最終的に採用した書き換え案を作り出したのです。このモデルは、位置を失うことなく、情報のライブラリ全体を「記憶」し、相互参照できます。これにより、以前のバージョンで問題になっていた「ハルシネーション」を減らします。
OpenAIは、GPT-5.5が「自己修正」と自律性のために最適化されていると主張しています。曖昧な指示を解釈し、コンピュータ・インターフェース (クリック、タイピング、ブラウジング) を使って、人間の介入なしに目的を達成するのが得意です。モデルは、エージェントがソフトウェアを操作する必要がある場合、ターミナル中心のワークフローを管理する必要がある場合、またはコードベース全体 (500K+ tokens) にわたって高い検索精度で推論する必要がある場合に、特に有用になります。
ChatGPTにおいてOpenAIは「GPT-5.5 Thinking」を導入しました。同社によれば、この機能はより難しい問題に対してより速い支援を可能にするとのことです。この機能は、複雑なタスクをより効率よく完了できるように、より賢く、より簡潔な回答を提供します。プラグインを使用する際には、情報の統合・分析、コーディング、調査などドキュメント量の多いタスクにおいて特に優れています。
初期のGPT-5.5 Proのテスターは、ChatGPTが引き受けられる仕事の質と難易度の両方で大幅な改善があったと報告しています。低遅延により、GPT-5.4 Proよりも要求の厳しいタスクで実用的です。GPT-5.5 Proの応答は、よく構造化され、関連性があり、有用で正確であり、特に法律、データサイエンス、ビジネス、教育で強いパフォーマンスを示します。
基本バージョンは利用可能ですが、最も高機能なバージョン (GPT-5.5 Pro) は個人の購読者に対して月100ドルかかります。企業向けには、出力トークンあたりのコストは、トークン効率が40%高いとしても、GPT-5.4の約2倍です。大規模なエージェント型導入における総支出は大きくなり得ます。最高位の推論が、資金の潤沢な企業にのみ利用できる「贅沢品」になるのではないか、という懸念が高まっており、それによって大企業と小さなスタートアップの間の生産性格差が拡大する可能性があります。