
Google 9 червня у своєму офіційному блозі оголосила про запуск Gemini 3.5 Live Translate — це найновіша аудіомодель Gemini Live API, яка має усунути паузи в діалогах під час синхронного перекладу через очікування завершення всієї репліки. Gemini 3.5 Live Translate автоматично виявляє понад 70 мов і використовує безперервне генерування для виведення перекладу.
Підтверджені технічні характеристики Gemini 3.5 Live Translate
Механізм перекладу: Gemini 3.5 Live Translate використовує підхід «мова-до-мови» (audio-to-audio), динамічно перемикаючись між режимами «очікування додаткового контексту для підвищення точності» та «негайне виведення, щоб встигати за мовцем». Загальний розрив у перекладі становить кілька секунд.
Збереження мовних характеристик: Перекладений вивід зберігає інтонацію (intonation), темп (pacing) і висоту тону (pitch) мовця, а не подає їх як уніфікований машинний голос.
Відмінності від попередніх рішень (підтверджено Google): Раніше системам голосового перекладу потрібно було чекати, доки мовець виголосить повне речення, перш ніж почати переклад, через що в діалозі виникала перерва; Gemini 3.5 Live Translate замінює цей механізм безперервним генеруванням.
Три підтверджені канали запуску того ж дня
Відкритий девелоперський попередній доступ: Gemini Live API та Google AI Studio — доступні з 9 червня 2026 року.
Приватний попередній доступ для компаній: Google Meet — корпоративний приватний попередній доступ із червня 2026 року.
Глобальне оновлення для споживачів: Android- та iOS-версії застосунку Google Перекладач уже синхронно оновлено; на Android також додали «Режим слухання» — під час піднесення телефона до вуха перекладений голос відтворюється з динаміка, без потреби в навушниках і без впливу на навколишнє середовище. Google наводить приклади застосовних сценаріїв, зокрема іншомовні екскурсії в музеї або приймання дзвінків іноземною мовою в тихих місцях.
Підтверджена ринкова конкурентна ситуація та партнери
Конкуруючі продукти того ж класу (вже вийшли): Meta SeamlessM4T, Samsung Galaxy AI для перекладу під час дзвінків у реальному часі, Apple Live Translation, OpenAI Realtime API.
Інтеграційне тестування Grab (підтверджено): Платформа виклику таксі в Південно-Східній Азії Grab тестує, як Gemini 3.5 Live Translate забезпечить миттєве багатомовне спілкування між водієм і пасажиром; користувачі Grab щомісяця здійснюють через її платформу понад 10 млн голосових дзвінків, а мови охоплюють тайську, в’єтнамську, малайську, індонезійську та філіппінську.
Відгуки ранніх партнерів (підтверджено): CJ ENM і LiveKit повідомили, що якість перекладу, точність і затримка досягли очікуваних показників.
Поширені запитання
У чому основна різниця між Gemini 3.5 Live Translate та попередніми голосовими функціями Google Перекладача?
Згідно з офіційним поясненням Google, головна відмінність полягає в зміні моменту виконання перекладу. Раніше голосовий переклад потребував, щоб мовець виголосив повне речення, перш ніж почати переклад, що переривало діалог; Gemini 3.5 Live Translate використовує безперервне генерування, тож загальний розрив скорочується до кількох секунд, а також зберігаються інтонація, темп і висота тону мовця.
Як використовувати та в яких сценаріях застосовувати Android «Режим слухання»?
«Режим слухання» — це нова функція в Android-версії Google Перекладача. Коли користувач підносить телефон до вуха, перекладений голос відтворюється з динаміка, без потреби в Bluetooth-гарнітурі та без того, щоб через зовнішні гучномовці впливати на навколишнє середовище. Google наводить приклади сценаріїв, зокрема іншомовні екскурсії в музеях і приймання дзвінків іноземною мовою в тихих місцях.
Як зараз отримати Gemini 3.5 Live Translate?
Станом на 9 червня 2026 року Gemini 3.5 Live Translate доступний через три канали: відкритий попередній доступ для девелоперів Gemini Live API та Google AI Studio; приватний корпоративний попередній доступ Google Meet (запуск цього місяця); а також глобальне оновлення застосунку Google Перекладач для Android і iOS.