Google Gemini 3.5: Übersetzungs-Upgrade, 70 Sprachen brechen mit Live-Dolmetschen die Stopps ab

2026-06-10 03:13:48

Google hat am 9. Juni über seinen offiziellen Blog die Einführung von Gemini 3.5 Live Translate angekündigt. Dabei handelt es sich um das neueste Audiomodell der Gemini Live API. Ziel ist es, Gesprächspausen zu beseitigen, die bei Live-Sprachübersetzungen dadurch entstehen, dass man warten muss, bis ein ganzer Satz zu Ende ist. Gemini 3.5 Live Translate erkennt automatisch über 70 Sprachen und gibt Übersetzungen im fortlaufenden Generierungsmodus aus.

Bestätigte technische Kernfunktionen von Gemini 3.5 Live Translate

Übersetzungsmechanismus: Gemini 3.5 Live Translate setzt auf die „Sprache-zu-Sprache“-Übersetzung. Dabei passt das System die Ausgabe in Echtzeit dynamisch zwischen „Warten auf mehr Kontext, um die Genauigkeit zu verbessern“ und „sofort ausgeben, um mit der sprechenden Person Schritt zu halten“ an. Die gesamte Übersetzungsabweichung beträgt nur einige Sekunden.

Beibehalten der Stimmeigenschaften: Die Übersetzungsausgabe behält die Intonation (Sprechmelodie), das Tempo (pacing) und die Tonhöhe (pitch) der sprechenden Person bei, statt in einer einheitlichen Maschinensprache-Tonspur dargestellt zu werden.

Unterschiede zu Vorgängerversionen (von Google offiziell bestätigt): Bisher mussten Sprachübersetzungssysteme warten, bis der Sprecher einen vollständigen Satz gesagt hatte, bevor die Übersetzung startete, was zu Unterbrechungen im Gespräch führte; Gemini 3.5 Live Translate ersetzt diese Wartefunktion durch einen fortlaufenden Generierungsmodus.

Drei bestätigte Onboarding-Kanäle, die am selben Tag starten

Entwickler: öffentliche Vorschau: Die Gemini Live API und Google AI Studio sind ab dem 9. Juni 2026 verfügbar.

Unternehmens: private Vorschau: Google Meet Enterprise startet ab Juni 2026 mit einer privaten Vorschau.

Konsumenten: weltweites Update: Die Google Übersetzer-App für Android und iOS wurde ebenfalls synchron aktualisiert. Android ergänzt zusätzlich den „Hörmodus“: Wenn man das Handy nahe ans Ohr hält, wird die übersetzte Sprache über den Hörer ausgegeben. Es sind keine Kopfhörer erforderlich, und die Umgebung wird nicht beeinträchtigt. Google nennt als Anwendungsbeispiele etwa mehrsprachige Führungen im Museum oder das Entgegennehmen fremdsprachiger Telefonate in ruhigen Umgebungen.

Bestätigte Wettbewerbslandschaft und Partner

Gleichartige Konkurrenzprodukte (bereits verfügbar): Meta SeamlessM4T, Samsungs Galaxy AI Übersetzung für Live-Calls, Apple Live Translation, OpenAI Realtime API.

Grab-Integrationstests (bestätigt): Die Ride-Hailing-Plattform Grab in Südostasien testet derzeit, wie Gemini 3.5 Live Translate eine sofortige mehrsprachige Kommunikation zwischen Fahrer und Fahrgast ermöglicht. Grab-Nutzer tätigen monatlich über ihre Plattform mehr als 10,0 Millionen Sprachtelefonate. Die Sprachen umfassen Thailändisch, Vietnamesisch, Malaiisch, Indonesisch und Filipinisch.

Rückmeldungen von frühen Kooperationspartnern (bestätigt): CJ ENM und LiveKit berichten, dass Übersetzungsqualität, Genauigkeit und Latenz den Erwartungen entsprechen.

Häufige Fragen

Was sind die wichtigsten Unterschiede zwischen Gemini 3.5 Live Translate und der bisherigen Google-Übersetzungsfunktion für Sprache?

Laut Angaben von Google besteht der Hauptunterschied in der Veränderung des Übersetzungszeitpunkts. Zuvor musste man warten, bis der Sprecher einen ganzen Satz gesagt hatte, bevor die Sprachübersetzung startete, was zu Gesprächsunterbrechungen führte; Gemini 3.5 Live Translate nutzt einen fortlaufenden Generierungsmodus. Dadurch wird die gesamte Verzögerung auf wenige Sekunden verkürzt, während gleichzeitig die Intonation, das Tempo und die Tonhöhe des Sprechers beibehalten werden.

Wie verwendet man den Android-„Hörmodus“ und für welche Einsatzszenarien eignet er sich?

Der „Hörmodus“ ist eine neue Funktion der Android-Version der Google Übersetzer-App. Wenn Nutzer das Handy ans Ohr halten, wird die übersetzte Sprache über den Hörer ausgegeben. Man muss keine Bluetooth-Kopfhörer verwenden und die Umgebung wird nicht durch externe Lautsprecher beeinträchtigt. Google nennt als geeignete Einsatzszenarien mehrsprachige Führungen im Museum sowie das Entgegennehmen fremdsprachiger Telefonate in ruhigen Umgebungen.

Wie kann man Gemini 3.5 Live Translate derzeit bekommen?

Stand 9. Juni 2026 wird Gemini 3.5 Live Translate über drei Kanäle freigegeben: die Entwickler-öffentliche Vorschau der Gemini Live API und von Google AI Studio; die private Unternehmensvorschau von Google Meet (Start in diesem Monat); sowie das weltweite Update der Google Übersetzer-App für Android und iOS.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.