MicrosoftのFara1.5 AIがWebブラウジングでOpenAIとGoogleを上回る

Microsoft Researchは今週、ウェブ閲覧タスク向けのオープンウェイトAIモデル「Fara1.5」をリリースし、業界ベンチマークにおいてOpenAIのOperatorやGoogleのGemini 2.5 Computer Useを上回った。Fara1.5-27BはOnline-Mind2Webで72%を記録し、OpenAI Operatorの58.3%およびGemini 2.5 Computer Useの57.3%を上回った。このリリースは、コンピューター利用エージェントの競争環境の転換を示している。コンピューター利用エージェントとは、ブラウザ画面を読み取り、特別なプラグインを必要とせずにクリック、スクロール、タイピングといった行動を行うよう設計されたAIシステムだ。OpenAIの独自のクラウドベースOperator(2025年1月に月額$200で開始され、8月に停止)やGoogleの提供と異なり、Fara1.5はオープンソースで、公開された重みを備えている。Microsoftは、データ生成や学習目標からモデル設計、オーケストレーションまで、開発プロセス全体を見直すことでこの性能を実現した。

モデル仕様と提供状況

Fara1.5は3つのサイズ、4 billion、9 billion、27 billionのパラメータで提供されており、いずれもMicrosoftがブラウザ作業向けに特別に微調整したAlibabaのベースモデルQwen 3.5に基づいている。中規模のFara1.5-9BはOnline-Mind2Webで63.4%を記録し、OpenAIとGoogleの両方の提供を上回った。9 billionパラメータモデルは現在Azure AI Foundryで稼働中で、4 billion版と27 billion版は間もなく提供される。

ベンチマークの性能

主要ベンチマークであるOnline-Mind2Webは、136の人気のあるライブなウェブサイトにまたがって、300の多様で実世界のタスクをAIエージェントがどれだけ正しく完了できるかをテストする。商品比較、フォーム入力、予約サービスなどが含まれる。スコアは、実際に変化するインターネット上で正しく完了したタスクを反映している。

ライブウェブ上でのタスク成功を測る第2のベンチマークであるWebVoyagerでは、Fara1.5-27Bが88.6%を達成し、OpenAI Operatorの87.0%をわずかに上回り、83.0%のH CompanyのHolo2(30-billionパラメータ)を上回った。

オープンソースの競合はより低いスコアだった。AlibabaのGUI-Owl-1.5(8 billionパラメータ)は48.6%に到達し、AI2のMolmoWebは35.3%だった。Microsoftの従来モデルであるFara-7Bは34.1%を記録しており、同等の規模においてFara1.5-27Bが前身の性能をほぼ倍増させたことを意味する。最上位の専有型代替であるYutoriのNavigator n1は64.7%に達した。

学習手法

MicrosoftはFaraGen1.5を使って学習データを生成し、GPT-5.4――OpenAIのモデル――を「教師エージェント」として用いて、ブラウザタスクの完了方法をデモンストレーションさせた。これらのデモはFara1.5の学習データになった。

また、メールクライアント、カレンダー、マーケットプレイスを含む、実在ウェブサイトの完全に機能するレプリカを6つ作成した。この合成ドメインの学習により、ログインや取り返しのつかない行動を伴うタスクを、実際のアカウントにアクセスせずに練習でき、「ゲート付き」タスクでの性能が向上した。

安全性とユーザーによる制御

すべてのモデルは、不可逆な行動を行う前に必ず停止して確認を求めるよう設計されている。Fara1.5は、すべての行動を記録し、ユーザーがどの時点でもエージェントを止められる、サンドボックス化されたブラウザ環境のMagenticLite上で動作する。Microsoft ResearchのシニアPMリードであるYash Laraによれば、「Critical Pointsのような堅牢なセーフガードと、シームレスなユーザージャーニーのバランスを取ることが重要です。Microsoft ResearchのMagentic-UIのようなUIがあることは、必要なときにユーザーが介入できる機会を与えるうえで不可欠であり、同時に承認疲れを避けるのにも役立ちます。」

今後の拡張

Microsoftは、Fara1.5をブラウザだけでなく、デスクトップやエンタープライズ向けソフトウェアアプリケーションにも広げる計画だと述べた。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし