Google、最強のAIモデルGemini 3を発表—知っておくべきこと

デクリプトのアート、ファッション、エンターテインメントハブ。


SCENEを見る


Googleは本日、Gemini 3 Proを公開プレビューとしてリリースし、同社のこれまでで最も能力のあるAIモデルだと呼びました。このシステムは、テキスト、画像、音声、動画を同時に処理し、最大100万トークンのコンテキストを処理します—これは約70万語、または約10冊の長編小説に相当します。

プレビューモデルは、誰でもここで無料で試すことができます。

Googleは、このモデルが同社がテストしたほぼすべてのベンチマークで前のモデルであるGemini 2.5 Proを上回ったと述べています。人類最後の試験という学術的な推論テストでは、Gemini 3 Proは37.5%を記録し、2.5 Proの21.6%と比較されました。視覚的推論パズルのベンチマークであるARC-AGI-2では、ギャップはさらに広がり、31.1%対4.9%となりました。

もちろん、AI競争における本当の課題は、技術的なものというよりも、商業市場のシェアを獲得することです。

かつて検索分野で無敵のように思われていたGoogleは、800万人の週次ユーザーを持つChatGPTに対し、約6億5千万月間ユーザーを持つGeminiに対して、膨大な地盤を失いました。Googleは週次の数字がどれくらいかを明らかにしていませんが、それは月間のカウントよりもはるかに少ないでしょう。

それでも、ジェミニ 3 の技術的成果は印象的です。

ジェミニ3を紹介します — あらゆるアイデアを実現するための最も知的なモデルです。

Gemini 3 は、AGI に向かう道の次のステップであり、次の機能を備えています:

🧠 > 最先端の推論

🖼️ 深いマルチモーダル理解

💻 強力なバイブコーディングで、プロンプトからアプリまで一気に進めることができます… pic.twitter.com/zG8r95pGcS

— Google (@Google) 2025年11月18日


Gemini 3 Proは、Googleが呼ぶところのスパースミクスチャーオブエキスパートアーキテクチャを使用しています。すべての1兆を超えるパラメータをすべてのクエリに対してアクティブにするのではなく、システムは各入力を専門のサブネットワークにルーティングします。特定のタスクに特化したエキスパートだけが、常に実行されるモデルの一部であり、計算コストを削減しつつパフォーマンスを維持します。

GPTやClaudeとは異なり、これらは大規模で密なモデルであり(オールラウンドのジャック)、Googleのアプローチは大規模な組織が運営されるように機能します。1,000人の従業員を抱える会社は、すべての会議に全員を呼ぶことはありません; 特定のチームが特定の問題を扱います。Gemini 3 Proは同様に機能し、質問を適切な専門家ネットワークに指示します。

Googleはウェブ文書、コードリポジトリ、画像、音声ファイル、ビデオ、さらに他のAIシステムによって生成された合成データを用いてモデルを訓練しました。企業は、ポルノコンテンツ、暴力的な素材、子供の安全法に違反するものを除去し、トレーニングデータの品質と安全性をフィルタリングしました。訓練はGoogleのテンソル処理ユニットを使用して、JAXとML Pathwaysソフトウェアで行われました。

モデルの簡単なテストでは、非常に優れた能力を示しました。ステルスゲームを生成するように求める通常のコーディングテストでは、これは2D体験の代わりに3Dゲームを生成した最初のモデルでした。他の実行では2Dバージョンが提供されましたが、すべて機能的で速かったです。

このアプローチは、フォローアップの質問や提案を共有することでさらなるインタラクションを促すChatGPTやPerplexityのスタイルに従っていますが、Googleの実装ははるかにクリーンで役立ちます。

コードを生成している間、インターフェースは後のプロンプトを助けるためのヒントを提供し、ユーザーがモデルを誘導してより良いコードを生成し、バグを修正し、アプリのロジックやUIなどを改善できるようにします。また、ユーザーには自分のコードやGemini搭載アプリをデプロイするオプションも提供されます。

全体として、このモデルは特にコーディングタスクに焦点を当てているようです。創造性は強みではありませんが、良いシステムプロンプトと例を使えば簡単に誘導できます。非常に大きなトークンコンテキストウィンドウを持っています。

Gemini 3のモデルカードのアーカイブ版—モデルの設計、意図された使用法、パフォーマンス、および制限に関する重要な情報を提供する文書—がGoogle DeepMindによって公開され、Gemini 3 Proは最大64,000トークンの出力を生成でき、知識のカットオフは2025年1月であることが示されています。Googleは、このモデルが幻覚を引き起こす可能性があり、時折遅延やタイムアウトが発生することを認めました。

公式モデルカードは現在利用できません。

前述のように、Google AI Studioは現在、誰でもGemini 3 Proに無料でアクセスできるようにしています。Vertex AIとGemini APIもこのモデルをサポートしています。ただし、Gemini 3 ProはGeminiアプリを通じてはまだ利用できません—有料のGemini Proサブスクライバーでさえも。

11月のリリースは、GoogleをAnthropicのClaude Sonnet 4.5、Grok 4.1、さらにはOpenAIのGPT-5.1に対抗させます。ベンチマークスコアは、Gemini 3 Proが推論とマルチモーダルタスクで優れていることを示唆していますが、実際のパフォーマンスは使用ケースによって異なります。

Googleは、既存のサービス利用規約に従って、クラウドプラットフォームを通じてGemini 3 Proを配布しました。同社の生成AI禁止使用ポリシーが適用され、危険な活動、セキュリティの侵害、性的に露骨なコンテンツ、暴力、ヘイトスピーチ、および誤情報での使用がブロックされます。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン