Google Gemini 3.5 翻譯升級,70 語言即時口譯終結停頓

Google翻譯升級

Google 於 6 月 9 日在官方部落格宣布推出 Gemini 3.5 Live Translate,這是 Gemini Live API 的最新音訊模型,目標是消除即時語音翻譯中因等待整句結束而產生的對話停頓。Gemini 3.5 Live Translate 自動偵測 70 多種語言,採用持續生成方式輸出翻譯。

Gemini 3.5 Live Translate 的已確認技術特性

翻譯機制: Gemini 3.5 Live Translate 採用「語音對語音」翻譯方式,動態在「等待更多上下文以提升準確度」與「立即輸出以跟上說話者」之間即時調整,整體翻譯落差為數秒。

語音特徵保留: 翻譯輸出保留說話者的語調(intonation)、節奏(pacing)與音高(pitch),而非以統一機器語音呈現。

與前代的差異(Google 官方確認): 此前的語音翻譯系統需等待說話者講完完整一句才開始翻譯,造成對話中斷;Gemini 3.5 Live Translate 以持續生成方式取代此等待機制。

三個已確認的同日上線管道

開發者公開預覽: Gemini Live API 與 Google AI Studio,2026 年 6 月 9 日起開放。

企業私人預覽: Google Meet 企業版,2026 年 6 月起啟動私人預覽。

消費者全球更新: Android 與 iOS 版 Google 翻譯 App 已同步更新;Android 另新增「聆聽模式」,將手機貼近耳朵時翻譯語音從聽筒播出,無需耳機且不影響周遭環境,Google 舉例適用場景包括博物館外語導覽或安靜場合接外語電話。

已確認的市場競爭格局與合作夥伴

同類競爭產品(已上市): Meta SeamlessM4T、三星 Galaxy AI 即時通話翻譯、Apple Live Translation、OpenAI Realtime API。

Grab 整合測試(已確認): 東南亞叫車平台 Grab 正在測試以 Gemini 3.5 Live Translate 實現司機與乘客的即時多語溝通;Grab 用戶每月透過其平台撥打超過 1,000 萬通語音通話,語言涵蓋泰語、越南語、馬來語、印尼語與菲律賓語。

早期合作夥伴回饋(已確認): CJ ENM 和 LiveKit 回饋翻譯品質、準確度與延遲均達預期。

常見問題

Gemini 3.5 Live Translate 與先前 Google 翻譯語音功能的主要差異是什麼?

根據 Google 官方說明,主要差異在於翻譯時機的改變。此前的語音翻譯需等待說話者講完整句才開始翻譯,造成對話中斷;Gemini 3.5 Live Translate 採用持續生成方式,整體落差縮短至數秒,同時保留說話者的語調、節奏與音高。

Android「聆聽模式」的使用方式與適用場景為何?

「聆聽模式」為 Android 版 Google 翻譯的新功能,用戶將手機貼近耳朵時,翻譯語音從聽筒播出,無需搭配藍牙耳機,也不會通過外置揚聲器影響周遭環境。Google 列舉的適用場景包括博物館外語導覽及安靜場合接外語電話。

Gemini 3.5 Live Translate 目前如何取得?

截至 2026 年 6 月 9 日,Gemini 3.5 Live Translate 透過三個管道開放:Gemini Live API 和 Google AI Studio 的開發者公開預覽;Google Meet 的企業私人預覽(本月啟動);以及 Android 和 iOS 版 Google 翻譯 App 的全球更新。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆