OpenAI 推 GPT-Realtime-2:把 GPT-5 推理帶入語音 Agent、context 升至 128K

鏈新聞abmedia

OpenAI 5 月 7 日(美國時間)在開發者大會公布三款新的 Realtime 語音模型:GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper、全部透過 Realtime API 對開發者開放。OpenAI 官方公告說明、GPT-Realtime-2 是 OpenAI 第一個具備 GPT-5 級推理能力的語音模型、能在語音對話中即時推理、呼叫工具、處理修正、並維持自然對話節奏。

GPT-Realtime-2:context 從 32K 升到 128K、五段推理強度可調

GPT-Realtime-2 的核心升級:

context window:32K 升至 128K tokens

推理強度可調:minimal、low、medium、high、xhigh 五段

Big Bench Audio 測試:high 推理 96.6%、前代 GPT-Realtime-1.5 為 81.4%

Audio MultiChallenge 指令遵循:xhigh 推理 48.5%、前代 34.7%

更大的 context 與可調推理強度讓開發者能根據場景在「便宜快速」與「深度思考」之間切換—簡單客服可用 minimal 模式控制成本、複雜任務切到 xhigh 換取 GPT-5 級推理品質。

同步發布兩款專用模型:Translate 跨語言、Whisper 即時轉錄

本輪三款新模型分工:

GPT-Realtime-Translate:即時多語語音翻譯、支援 70 種輸入語言、13 種輸出語言

GPT-Realtime-Whisper:低延遲串流轉錄、邊講邊出文字、適用即時字幕、會議記錄、課堂逐字稿

GPT-Realtime-2:完整對話 Agent、可推理、用工具、執行動作

Translate 與 Whisper 是針對特定語音應用做模型專門化—翻譯與轉錄的延遲與成本敏感度高於通用對話、用獨立模型可優化各自指標。

定價:GPT-Realtime-2 每百萬輸入 32 美元、輸出 64 美元

三款模型的價格結構:

GPT-Realtime-2:每百萬語音輸入 32 美元、cached 輸入 0.40 美元、輸出 64 美元

GPT-Realtime-Translate:每分鐘 0.034 美元

GPT-Realtime-Whisper:每分鐘 0.017 美元

後續可追蹤的具體事件:GPT-Realtime-2 在生產環境語音 Agent 的實際採用情況、與既有 GPT-4o 語音模型的 cannibalization 程度、以及 Anthropic、Google 等同業的對標反應。

這篇文章 OpenAI 推 GPT-Realtime-2:把 GPT-5 推理帶入語音 Agent、context 升至 128K 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

SNS 於 5 月 7 日推出 MCP 協議,讓 AI 代理程式可管理 .sol 網域

根據 SNS 於 2026 年 5 月 7 日的官方公告,SNS MCP(Model Context Protocol)已正式上線,使 AI 代理能夠透過對話互動,在 Solana 上探索、註冊並管理 .sol 網域。使用者現在可將 Claude AI 與 OpenClaw 等相容的 AI 平台連接到

GateNews14分鐘前

南韓推出 $8M AI 資安基金,供 50 家公司使用

根據《朝鮮日報》,南韓科學與資訊通信部以及韓國網際網路與安全局將在 2026 年資訊安全新技術支援計畫中投資 120 億韓元(830 萬美元)。該計畫旨在支援 50 家公司,投入 18 項 AI 安全任務

Crypto Frontier14分鐘前

OpenAI 將 ChatGPT 廣告試點擴展至南韓、英國、日本、巴西、墨西哥,時間為 5 月 7 日

根據《韓國時報》(The Korea Times),OpenAI 於 5 月 7 日宣布,將把其 ChatGPT 廣告試點擴展至南韓、英國、日本、巴西和墨西哥,以便在超出其最初市場(美國、加拿大、澳洲與紐西蘭)的情況下,將免費用戶變現。 測試將針對 Free 和 Go 方案的成人用戶,

GateNews14分鐘前

美國與中國將啟動官方 AI 安全對話,由財政部官員領導

根據報導,美國與中國正準備啟動一場官方的 AI 安全對話,目標是為其技術競賽建立危機管理機制。美國代表團將由財政部長 Scott Bessent 領導,而中國則將由副…

GateNews44分鐘前

RLWRLD 發布用於工業機器手的 RLDX-1 AI 模型

RLWRLD,這家由 LG Electronics 支援的機器人 AI 新創公司,根據 RLWRLD 公布,推出了 RLDX-1,一種為工業應用而設計的五指機器手基礎模型。該公司已在 GitHub 與 Hugging Face 上釋出該模型的權重、程式碼與技術文件。 Model

Crypto Frontier1小時前

DeepMind AlphaEvolve 跨領域戰績:4×4 矩陣乘法刷新 Strassen 1969 紀錄、Gemini 訓練快 1%

Google DeepMind 5 月 7 日(美國時間)發布 AlphaEvolve 跨領域成果報告。DeepMind 官方部落格整理 AlphaEvolve 自推出以來的具體進展:找到比 Strassen 1969 演算法更好的 4×4 複數矩陣乘法方法(48 次純量乘法)、與陶哲軒(Terence Tao)等數學家合作解決多個 Erdős(艾狄胥)數學難題、為 Google 資料中心節省 0.7% 全球運算資源、把 Gemini 訓練的關鍵 kernel 速度提升 23%、整體 Gemini 訓練時間減少 1%。 架構:Gemini Flash 廣度探索 + Gemini

鏈新聞abmedia1小時前
留言
0/400
暫無留言