Google Mengumumkan Gemini 3.5 Live Translate untuk Terjemahan Suara 70+ Bahasa

Google mengumumkan Gemini 3.5 Live Translate, model AI speech-to-speech yang menyediakan terjemahan instan dari suara ke suara untuk lebih dari 70 bahasa. Rilis ini memperluas ketersediaan terjemahan real-time di luar persyaratan sebelumnya untuk ponsel Google atau earbud tertentu, dengan latensi yang lebih rendah dibanding implementasi sebelumnya. Google telah mengejar terjemahan real-time selama bertahun-tahun sebagai salah satu eksperimen machine learning perintisnya; sebelumnya, Google sempat meluncurkan terjemahan real-time terbatas di aplikasi Translate tahun lalu sebelum penyebaran yang lebih luas hari ini.

Spesifikasi Teknis dan Keluarga Model Gemini 3.5 Live Translate

Gemini 3.5 Live Translate merupakan bagian dari keluarga versi 3,5 yang diluncurkan di I/O. Sebelum hari ini, Google baru merilis versi Flash, sementara model Pro diperkirakan akan dirilis dalam beberapa minggu mendatang. Model speech-to-speech disetel untuk secara otomatis mendeteksi dan menerjemahkan lebih dari 70 bahasa.

Menurut Google, Gemini 3.5 Live Translate cukup cepat untuk mengikuti percakapan normal, tertinggal hanya beberapa detik di belakang pembicara sekaligus menyesuaikan intonasi, kecepatan bicara, dan nada. Model menghasilkan output suara yang terdengar lebih seperti pembicara aslinya dibanding robot generik. Google merilis demo yang direkam dalam kondisi terkontrol untuk menunjukkan kemampuan tersebut.

Penyebaran di Ekosistem Google dan Akses Pengguna

Gemini 3.5 Live Translate mulai diluncurkan di beberapa bagian ekosistem Google. Model ini tersedia di Google Meet untuk terjemahan saat panggilan video berlangsung. Pengguna dapat mengakses kemampuan terjemahan tanpa menunggu periode verifikasi yang panjang.

Akses API untuk Pengembang dan Fitur Pemrosesan Otomatis

Pengembang dapat mulai membangun dengan pratinjau publik di Gemini Live API atau AI Studio. Model memproses ucapan secara berkelanjutan dan menangani semua input multibahasa secara otomatis, sehingga menghemat kerja pengembang untuk mengonfigurasi pengaturan secara manual. Model ini juga menyaring gangguan suara latar di lingkungan yang ramai.

FAQ

Bahasa apa saja yang didukung Gemini 3.5 Live Translate? Gemini 3.5 Live Translate mendukung lebih dari 70 bahasa dengan kemampuan deteksi dan terjemahan otomatis.

Di mana pengguna bisa mengakses Gemini 3.5 Live Translate? Model ini diluncurkan di beberapa bagian ekosistem Google, termasuk Google Meet untuk terjemahan ucapan, dan pengembang dapat mengaksesnya melalui pratinjau publik Gemini Live API atau AI Studio.

Bagaimana Gemini 3.5 Live Translate menangani pemrosesan ucapan? Model memproses ucapan secara berkelanjutan, secara otomatis menangani input multibahasa tanpa konfigurasi manual, dan menyaring noise latar di lingkungan yang ramai sambil menyesuaikan intonasi, kecepatan bicara, dan nada pembicara.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar