Laut Beating hat OpenAI in seiner Realtime-API drei Sprachmodelle veröffentlicht: GPT-Realtime-2 für Sprachgespräche mit Reasoning, GPT-Realtime-Translate für Echtzeit-Übersetzung und GPT-Realtime-Whisper für Streaming-Transkription. GPT-Realtime-2 ist OpenAIs erstes Sprachmodell mit Reasoning-Fähigkeiten auf GPT-5-Niveau und erweitert das Kontextfenster von 32K auf 128K Tokens. Es unterstützt bis zu 1-2 Stunden dichte Konversation.
GPT-Realtime-2 verbesserte sich um 15,2 % im Big-Bench-Audio-Benchmark und um 13,8 % bei Audio MultiChallenge im Vergleich zu GPT-Realtime-1.5. GPT-Realtime-Translate unterstützt 70+ Eingangssprachen für Übersetzungen in 13 Ausgangssprachen. Preise: GPT-Realtime-2 bei 32 $ pro Million Eingabetokens und 64 $ pro Million Ausgabetokens; Translate bei 0,034 $ pro Minute; Whisper bei 0,017 $ pro Minute.
Related News
NVIDIA stellt Nemotron 3 Nano Omni vor: Open-Source-Multimodalmodell
OpenAI kündigt ChatGPT Futures an: 26 Studierende der ersten Kohorte erhalten 10.000 US-Dollar Förderung, verteilt über mehr als 20 Hochschulen
OpenAI veröffentlicht die MRC-Supercomputer-Netzwerkprotokolle! Gemeinsam mit Nvidia, AMD und Microsoft wird die Stargate-Infrastruktur aufgebaut