Google оголошує Gemini 3.5 Live Translate для голосового перекладу понад 70 мов

Google оголосила Gemini 3.5 Live Translate — мовленнєву AI-модель «від голосу до голосу», що забезпечує миттєвий голосовий переклад більш ніж на 70 мовах. Запуск розширює доступність перекладу в реальному часі порівняно з попередніми вимогами для конкретних телефонів або навушників Google, пропонуючи нижчу затримку, ніж попередні реалізації. Google роками працювала над перекладом у реальному часі як одним із своїх піонерських експериментів у машинному навчанні: раніше вона вже запускала обмежений переклад у реальному часі в застосунку Translate минулого року перед сьогоднішнім ширшим розгортанням.

Gemini 3.5 Live Translate Технічні специфікації та модельна лінійка

Gemini 3.5 Live Translate належить до лінійки версії 3.5, яка стартувала на I/O. До сьогодні Google випустила лише версію Flash, тоді як Pro-модель, за очікуваннями, з’явиться в найближчі тижні. Модель «від голосу до голосу» налаштована на автоматичне виявлення та переклад більш ніж на 70 мовах.

За даними Google, Gemini 3.5 Live Translate достатньо швидка, щоб іти в ногу зі звичайною розмовою: вона відстає від мовця лише на кілька секунд, при цьому узгоджує інтонацію, темп і висоту голосу. Модель формує голосовий вивід, який звучить більше як оригінальний мовець, а не як узагальнений робот. Google опублікувала демо, записані в контрольованих умовах, які демонструють ці можливості.

Розгортання в екосистемі Google та доступ користувачів

Gemini 3.5 Live Translate розгортається в кількох частинах екосистеми Google. Модель доступна в Google Meet для перекладу мовлення під час відеодзвінків. Користувачі можуть скористатися можливостями перекладу без очікування тривалих періодів додаткової перевірки.

Доступ до API для розробників і функції автоматичної обробки

Розробники можуть почати будувати на основі публічного прев’ю в Gemini Live API або AI Studio. Модель обробляє мовлення безперервно та автоматично працює з усіма багатомовними входами, звільняючи розробників від ручного налаштування параметрів. Вона також відфільтровує фоновий шум у людних середовищах.

FAQ

На які мови підтримує Gemini 3.5 Live Translate? Gemini 3.5 Live Translate підтримує понад 70 мов із автоматичним виявленням та можливостями перекладу.

Де користувачі можуть отримати доступ до Gemini 3.5 Live Translate? Модель розгортається в кількох частинах екосистеми Google, зокрема в Google Meet для перекладу мовлення, а розробники можуть отримати до неї доступ через публічне прев’ю Gemini Live API або AI Studio.

Як Gemini 3.5 Live Translate обробляє мовлення? Модель обробляє мовлення безперервно, автоматично працює з багатомовними входами без ручного налаштування та відфільтровує фоновий шум у людних середовищах, одночасно узгоджуючи інтонацію, темп і висоту голосу мовця.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів