OpenAI випустила три голосові моделі в Realtime API; GPT-Realtime-2 має вікно контексту на 128K

2026-05-08 01:25:27

За даними Beating, OpenAI випустила три голосові моделі у своєму Realtime API: GPT-Realtime-2 для голосової розмови з міркуваннями, GPT-Realtime-Translate для перекладу в реальному часі та GPT-Realtime-Whisper для потокової транскрипції. GPT-Realtime-2 — перша голосова модель OpenAI з можливістю міркувань на рівні GPT-5: вона розширює контекстне вікно з 32K до 128K токенів і підтримує до 1–2 годин щільних розмов.

GPT-Realtime-2 покращила на 15,2% показники Big Bench Audio порівняно з GPT-Realtime-1.5 та на 13,8% на Audio MultiChallenge. GPT-Realtime-Translate підтримує 70+ вхідних мов і перекладає на 13 вихідних мов. Ціни: GPT-Realtime-2 — $32 за мільйон вхідних токенів і $64 за мільйон вихідних токенів; Translate — $0,034 за хвилину; Whisper — $0,017 за хвилину.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-08 00:42

OpenAI запустила функцію безпечних перевірених контактів учора, щоб попереджати користувачів про ризик

05-08 00:08

OpenAI запускає модель GPT-5.5-Cyber і фреймворк Trusted Access для кіберзахисників

05-07 12:21

Tether випускає медичну AI-модель QVAC MedPsy та досягає оцінки 62,62 на версії з 17 млрд параметрів

05-07 12:16

B.AI запускає чотири нові моделі, зокрема GPT-5.5 Instant, протягом 48 годин після релізу OpenAI

05-07 02:01

OpenAI запускає протокол MRC разом із AMD, Broadcom, Intel, Microsoft і Nvidia

Поглиблений аналіз