OpenAI、ネイティブなコンピューター利用を備えたGPT-5.5 AIモデルをリリース

CryptoFrontier

OpenAIは2026年4月23日に、ネイティブなコンピュータ利用能力を通じて現実世界のアプリケーションにおけるユーザーの意図を理解するよう設計された新しいAIモデル「GPT-5.5」を公式にリリースしました。OpenAIの発表によると、このモデルは汎用のネイティブ機能を備えており、デスクトップアプリケーションをナビゲートし、ボタンをクリックし、複数ステップのワークフローに対してテキストを入力できます。

GPT-5.5は、ネイティブなコンピュータ利用と高度な推論を組み合わせ、上級のプロフェッショナル作業に必要なソフトウェアツールを自律的にナビゲートします。モデルの約110万トークンのコンテキストウィンドウにより、これまで手作業でのチャンク分割が必要だった巨大な金融データセットを処理できます。OpenAIの金融チームはGPT-5.5を使って24,771のK-1税務フォーム (71,637ページ) をレビューし、前年度より2週間早くタスクを完了しました。

パフォーマンス・ベンチマーク

GPT-5.5は、社内の投資銀行モデリング業務で88.5%、FinancialAgent v1.1ベンチマークで60%を獲得し、GPT-5.4を4ポイント上回りました。このモデルはGDPvalで84.9%を達成しました。これは44の職業にまたがる特定の知識労働をエージェントが生み出す能力をテストするものです。OSWorld-Verified(モデルの自律的な実コンピュータ操作を測定)では、78.7%に到達しました。GPT-5.5は、非常に難しいカスタマーサービスのワークフローをテストするTau2-bench Telecomで98%を獲得しました。

Go-to-Marketチームの従業員は、週次のビジネスレポートを自動化すれば、毎週の手作業が約5〜10時間削減されると確認しました。

コード生成とシステム最適化

OpenAIは、GPT-5.5が自社のサービング基盤向けのコードを書くのを支援するために使用されたと報告しています。このモデルは、生産トラフィックのパターンを分析してカスタムの負荷分散ヒューリスティックを書き、自己の「システムレベル最適化」を達成しました。それにより、自己のトークン生成速度が20%向上しました。

開発者テストでは、モデルに「マークダウンエディタを再設計(リ-アーキテクト)せよ」と依頼し、最小限の人間による修正で、ほぼ完成した12-diffのスタックを返しました。OpenAIは、新しいモデルはより少ないターンで正しい答えに到達し、GPT-5.4と比べて同じCodexのタスクで40%少ないトークンを使用すると述べています。

Everyの創業者兼CEOであるDan Shipperは、GPT-5.5を「深刻な概念的明晰さ」を備えた最初のコーディングモデルだと説明しました。Shipperは、彼自身と最も優秀なエンジニアが、リリース後の問題のデバッグに数日費やした後、GPT-5.5をテストしました。Shipperによれば、GPT-5.5はGPT-5.4ではできなかったことを達成しました。つまり、壊れたコードを調べて、エンジニアが最終的に採用した書き換え案を作り出したのです。このモデルは、位置を失うことなく、情報のライブラリ全体を「記憶」し、相互参照できます。これにより、以前のバージョンで問題になっていた「ハルシネーション」を減らします。

自律的な能力と自己修正

OpenAIは、GPT-5.5が「自己修正」と自律性のために最適化されていると主張しています。曖昧な指示を解釈し、コンピュータ・インターフェース (クリック、タイピング、ブラウジング) を使って、人間の介入なしに目的を達成するのが得意です。モデルは、エージェントがソフトウェアを操作する必要がある場合、ターミナル中心のワークフローを管理する必要がある場合、またはコードベース全体 (500K+ tokens) にわたって高い検索精度で推論する必要がある場合に、特に有用になります。

GPT-5.5 Thinking機能

ChatGPTにおいてOpenAIは「GPT-5.5 Thinking」を導入しました。同社によれば、この機能はより難しい問題に対してより速い支援を可能にするとのことです。この機能は、複雑なタスクをより効率よく完了できるように、より賢く、より簡潔な回答を提供します。プラグインを使用する際には、情報の統合・分析、コーディング、調査などドキュメント量の多いタスクにおいて特に優れています。

初期のGPT-5.5 Proのテスターは、ChatGPTが引き受けられる仕事の質と難易度の両方で大幅な改善があったと報告しています。低遅延により、GPT-5.4 Proよりも要求の厳しいタスクで実用的です。GPT-5.5 Proの応答は、よく構造化され、関連性があり、有用で正確であり、特に法律、データサイエンス、ビジネス、教育で強いパフォーマンスを示します。

価格と利用可能性

基本バージョンは利用可能ですが、最も高機能なバージョン (GPT-5.5 Pro) は個人の購読者に対して月100ドルかかります。企業向けには、出力トークンあたりのコストは、トークン効率が40%高いとしても、GPT-5.4の約2倍です。大規模なエージェント型導入における総支出は大きくなり得ます。最高位の推論が、資金の潤沢な企業にのみ利用できる「贅沢品」になるのではないか、という懸念が高まっており、それによって大企業と小さなスタートアップの間の生産性格差が拡大する可能性があります。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
AprDaydreamvip
· 3時間前
希望公式提供一个可审计的行动日志/回放机制,否则出现问题时很难追责,尤其是自动操作资产类账户。
原文表示返信0
PaperHandsProvip
· 3時間前
現実の応用における「意図の理解」こそが難点であり、もう二度とあなたが航空券を予約したいのに履歴書を修正されるという恥ずかしい事態が起きないことを願います。
原文表示返信0
Half-SectionedSucculentvip
· 3時間前
少し期待している一方で、少し怖い:マウスをクリックできることは、多くの「人間のクリック」でしかできないことができることと同じであり、リスク管理と反不正行為対策の強化が必要になる。
原文表示返信0
ACalmnessWithAHintOfPomelovip
· 3時間前
この波はWeb3にも影響を与えるでしょう。自動化されたオンチェーン操作、署名プロセス、ウォレットのインタラクションがシームレスに行えるようになれば、製品の形態は変わるでしょう。
原文表示返信0
StarsInTheGlassDomevip
· 3時間前
APIと価格は急がず、まず複雑なデスクトップ環境でポップアップ、マルチウィンドウ、ネットワークのジッターに耐えられるかどうかを見てみましょう。
原文表示返信0
GateUser-b665e41cvip
· 3時間前
「話せて書ける」から「できて納品できる」へ進化するのを感じている。次のステップは、より良い記憶とタスク管理を提供することだ。
原文表示返信0
LintCollectorvip
· 3時間前
もし本当にアプリ間の連携が可能になれば:ブラウザで資料を検索→Excelで処理→PPTでプレゼン資料作成→メールで送信、これがオフィスの全工程のクローズド・ループとなる。
原文表示返信0
DegenWithNotebookvip
· 3時間前
ついにデスクトップネイティブ操作が登場したのか?これで本当に「デジタルインターン生」になるぞ。
原文表示返信0