据 Beating,Step Audio 2.5 Realtime(Step Cosmos 的端到端实时语音模型)于 2026 年 4 月在其开放平台 API 上线。该模型强调自然对话,支持可定制的角色人设,并具备副语言感知(语调、停顿、叹息)。
在官方五个维度的测试中,Step Audio 2.5 Realtime 在所有类别中均排名第一。主观评估得分(真实用户手机应用对话)达到 80.41,而 GPT-Realtime-1.5 为 68.01,Gemini Live 为 67.16。语音问答基准得分为 79.80,几乎是 GPT-Realtime-1.5 的 1.5 倍(53.20)。API 定价:每百万输入 token 收取 10 元(缓存命中为 2 元),每百万输出 token 收取 70 元;持续语音通话预计为每小时 3.8 元。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
软银削减由 OpenAI 支持的融资计划(从 $10B 到 $6B ),因贷款方担忧而发生变化
据 ChainCatcher 称,软银集团正在削减一项由 OpenAI 股权支持的融资计划,将规模从约 100 亿美元下调至 60 亿美元。贷款方对交易结构以及作为私营公司的 OpenAI 估值的可靠性提出了担忧,从而成为关键
GateNews26 分钟前
TCI 基金在抛售近 $8B 的微软股份,称其存在 AI 威胁
据《金融时报》报道,Chris Hohn 的对冲基金 TCI 最近出售了近 80 亿美元的微软股份。该基金告诉投资者,人工智能对微软在软件领域的主导地位构成威胁。
GateNews1小时前
Tessera Labs 完成由 a16z 领投的 $60M 融资轮次
据 Odaily 报道,AI 自动化初创公司 Tessera Labs 宣布完成一轮 6000 万美元的融资,由 Andreessen Horowitz(a16z)领投,Foundation Capital、Myriad Venture Partners 和 Osage University Partners 参与。该公司的 AI 原生平台可自动化企业
GateNews3小时前
攻击者通过 13 个账号向 Hugging Face 和 ClawHub 注入 575 项恶意技能
据 Mist Security 首席信息安全官 @im23pds 称,攻击者最近入侵了 13 个账户,以向 Hugging Face 和 ClawHub(OpenClaw)注入 575 个恶意 Skills,相关信息已在 X 平台披露。
GateNews3小时前
DeepSeek 计划在创纪录的融资轮中最多募集人民币 500 亿,并将在 6 月推出 V4.1 模型
据 PANews 5 月 8 日报道,DeepSeek 计划在首轮融资中最多筹集人民币 500 亿,这将成为中国 AI 公司单笔融资规模最大的融资。创始人兼 CEO 梁文峰预计将出资最多。该公司计划加速大语言模型
GateNews3小时前
Sportix 完成 320 万美元的融资轮,由 Coinvestor Ventures 领投,Animoca Brands 参与
据 ChainCatcher 称,体育 AI 基础设施平台 Sportix 已完成一轮 320 万美元的融资。该轮融资由 Coinvestor Ventures 牵头,Animoca Brands、Becker Ventures、X21 Digital 和 Alpha Capital 参与。
Sportix 表示,它将使用这笔资金来推进其 AI
GateNews3小时前