
Google hat am 9. Juni über seinen offiziellen Blog die Einführung von Gemini 3.5 Live Translate angekündigt. Dabei handelt es sich um das neueste Audiomodell der Gemini Live API. Ziel ist es, Gesprächspausen zu beseitigen, die bei Live-Sprachübersetzungen dadurch entstehen, dass man warten muss, bis ein ganzer Satz zu Ende ist. Gemini 3.5 Live Translate erkennt automatisch über 70 Sprachen und gibt Übersetzungen im fortlaufenden Generierungsmodus aus.
Übersetzungsmechanismus: Gemini 3.5 Live Translate setzt auf die „Sprache-zu-Sprache“-Übersetzung. Dabei passt das System die Ausgabe in Echtzeit dynamisch zwischen „Warten auf mehr Kontext, um die Genauigkeit zu verbessern“ und „sofort ausgeben, um mit der sprechenden Person Schritt zu halten“ an. Die gesamte Übersetzungsabweichung beträgt nur einige Sekunden.
Beibehalten der Stimmeigenschaften: Die Übersetzungsausgabe behält die Intonation (Sprechmelodie), das Tempo (pacing) und die Tonhöhe (pitch) der sprechenden Person bei, statt in einer einheitlichen Maschinensprache-Tonspur dargestellt zu werden.
Unterschiede zu Vorgängerversionen (von Google offiziell bestätigt): Bisher mussten Sprachübersetzungssysteme warten, bis der Sprecher einen vollständigen Satz gesagt hatte, bevor die Übersetzung startete, was zu Unterbrechungen im Gespräch führte; Gemini 3.5 Live Translate ersetzt diese Wartefunktion durch einen fortlaufenden Generierungsmodus.
Entwickler: öffentliche Vorschau: Die Gemini Live API und Google AI Studio sind ab dem 9. Juni 2026 verfügbar.
Unternehmens: private Vorschau: Google Meet Enterprise startet ab Juni 2026 mit einer privaten Vorschau.
Konsumenten: weltweites Update: Die Google Übersetzer-App für Android und iOS wurde ebenfalls synchron aktualisiert. Android ergänzt zusätzlich den „Hörmodus“: Wenn man das Handy nahe ans Ohr hält, wird die übersetzte Sprache über den Hörer ausgegeben. Es sind keine Kopfhörer erforderlich, und die Umgebung wird nicht beeinträchtigt. Google nennt als Anwendungsbeispiele etwa mehrsprachige Führungen im Museum oder das Entgegennehmen fremdsprachiger Telefonate in ruhigen Umgebungen.
Gleichartige Konkurrenzprodukte (bereits verfügbar): Meta SeamlessM4T, Samsungs Galaxy AI Übersetzung für Live-Calls, Apple Live Translation, OpenAI Realtime API.
Grab-Integrationstests (bestätigt): Die Ride-Hailing-Plattform Grab in Südostasien testet derzeit, wie Gemini 3.5 Live Translate eine sofortige mehrsprachige Kommunikation zwischen Fahrer und Fahrgast ermöglicht. Grab-Nutzer tätigen monatlich über ihre Plattform mehr als 10,0 Millionen Sprachtelefonate. Die Sprachen umfassen Thailändisch, Vietnamesisch, Malaiisch, Indonesisch und Filipinisch.
Rückmeldungen von frühen Kooperationspartnern (bestätigt): CJ ENM und LiveKit berichten, dass Übersetzungsqualität, Genauigkeit und Latenz den Erwartungen entsprechen.
Laut Angaben von Google besteht der Hauptunterschied in der Veränderung des Übersetzungszeitpunkts. Zuvor musste man warten, bis der Sprecher einen ganzen Satz gesagt hatte, bevor die Sprachübersetzung startete, was zu Gesprächsunterbrechungen führte; Gemini 3.5 Live Translate nutzt einen fortlaufenden Generierungsmodus. Dadurch wird die gesamte Verzögerung auf wenige Sekunden verkürzt, während gleichzeitig die Intonation, das Tempo und die Tonhöhe des Sprechers beibehalten werden.
Der „Hörmodus“ ist eine neue Funktion der Android-Version der Google Übersetzer-App. Wenn Nutzer das Handy ans Ohr halten, wird die übersetzte Sprache über den Hörer ausgegeben. Man muss keine Bluetooth-Kopfhörer verwenden und die Umgebung wird nicht durch externe Lautsprecher beeinträchtigt. Google nennt als geeignete Einsatzszenarien mehrsprachige Führungen im Museum sowie das Entgegennehmen fremdsprachiger Telefonate in ruhigen Umgebungen.
Stand 9. Juni 2026 wird Gemini 3.5 Live Translate über drei Kanäle freigegeben: die Entwickler-öffentliche Vorschau der Gemini Live API und von Google AI Studio; die private Unternehmensvorschau von Google Meet (Start in diesem Monat); sowie das weltweite Update der Google Übersetzer-App für Android und iOS.
Related News
Google kündigt Gemini 3.5 Live-Übersetzung für Sprachübersetzung mit 70+ Sprachen an
EU ordnet Meta an, den Zugriff auf WhatsApp-KI innerhalb von fünf Tagen wiederherzustellen
Apple bestätigt, dass Siris KI auf Google-Servern läuft, während es die Datenschutzbehauptungen aufrechterhält
Apple WWDC 2026: Mit einem Bündnis mit Google Gemini erhält Siri ein KI-Upgrade, iOS 27 bringt eine eigenständige App