GoogleはGemini人工知能のリアルタイム翻訳機能を発表し、従来のAndroidプラットフォームからiOSシステムに拡張し、イギリス、日本、台湾、ドイツなど多くの市場で同時にローンチされました。この更新は、モバイルデバイスやウェアラブルデバイスを通じて、より文脈を理解し自然なトーンの音声リアルタイム翻訳サービスを提供することを目的としており、その最大の特長はアプリが任意のブランドのBluetoothヘッドフォンと連携でき、Appleの仕様に制限されない点です。
iOSリアルタイム翻訳アプリは任意のブランドのBluetoothヘッドフォンと連携可能
これまで特定ブランドのリアルタイム翻訳機能は専用ハードウェアに制限されることが多かったですが、Googleが今回発表した「ヘッドフォンリアルタイム翻訳」機能はオープンアーキテクチャを採用しており、ユーザーはiPhoneまたはiPadにGoogle翻訳アプリをダウンロードするだけで、任意のブランドのワイヤレスBluetoothヘッドフォンと使用できるようになります。この新機能はハードウェアを超えて利用でき、iOSユーザーも移動中にリアルタイム情報を得ることができます。技術的にはGemini 3.1 Flash Liveモデルが駆動し、低遅延の音声処理を強調しており、現在70以上の言語に対応しており、このツールの国際ビジネスや個人旅行のシナリオでの実用価値を大幅に強化しています。
人工知能が音声翻訳の自然さを最適化
従来の逐語訳(Word-for-word translation)に比べて、Gemini技術を導入した翻訳ツールは意味解析と感情の保持に重点を置いています。システムは音声を処理する際、文字の翻訳だけでなく、元の話者の口調、アクセント、リズムを模倣し、機械的な音声による疎外感を減少させようとしています。慣用句(Idioms)やスラングを処理する際、人工知能は文脈に基づいてより正確な翻訳提案を提供し、英語の慣用表現を現地文化に合った語彙に翻訳します。
Google Meet音声翻訳の同期更新
音声翻訳機能はGoogle WorkspaceユーザーとGoogle AIプログラムの個人アカウントに正式に導入されました。これにより、話者の声にリアルタイムで音声の吹き替えが追加されます。これにより、参加者は母国語の翻訳を聞くことができ、話者の感情的な文脈も理解できます。現在、英語と多くの言語間で双方向翻訳をサポートしており、スペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語が含まれています。
マルチモーダル機能が環境認識を支援
音声通信に加えて、Googleはマルチモーダル(Multimodal)人工知能の適用範囲も強化しています。「リアルタイム検索」機能とGoogle Lensカメラを通じて、ユーザーは道路標識、メニュー、取扱説明書に直接焦点を合わせてリアルタイム翻訳を行い、その後Geminiと詳細な対話を行うことができます。語学学習において、Google翻訳アプリはスピーキング練習機能を拡張し、台湾、スウェーデン、インドなど20カ国で改善されたフィードバックメカニズムを導入しました。このシステムは、ユーザーの発音に具体的な提案を提供し、学習進捗(連続練習日数など)を追跡してユーザーが言語習得の目標を達成するのを支援し、個別化された学習体験を向上させます。
下半期にウェアラブルスマートグラスを発表予定
GoogleはSamsungやWarby Parkerなどの製造業者と協力し、最も早く2026年下半期に人工知能機能を搭載したスマートグラスを発表する予定です。この製品の主要なアプリケーションの一つは、レンズ内蔵の表示技術で、ユーザーの視界内に「リアルタイム字幕」を提供し、翻訳されたテキストを現実のシーンに直接投影します。このようなウェアラブルデバイスの開発は、翻訳技術が単なる画面表示から、視覚と聴覚を統合した環境認識サービスへと進化していることを象徴しています。現在、このシリーズの機能はテストおよび段階的な展開中であり、今後は各国ユーザーからのフィードバックに基づいてモデルの最適化が行われる予定です。
この記事はGoogleがGemini AIリアルタイム翻訳機能をiOSに拡張したことを発表したもので、最初に鏈新聞ABMediaに掲載されました。