Gate News 訊息,4 月 17 日——Google 於 4 月 15 日揭曉 Gemini 3.1 Flash TTS,這是一款先進的文字轉語音模型,強化了情感表達與控制功能。新模型將透過開發者 API、企業 Vertex AI,以及協作工具逐步推出。
模型的核心能力包括基於自然語言的音訊標籤,以便針對速度、語調與情感進行微調,並提供「Director Mode」用於指定場景與角色定位,以生成更細緻的語音輸出。多說話人功能可讓對話同時生成,使對話流程更自然,適用於播客、音訊內容與 AI 助理。模型支援超過 70 種語言與方言,反映不同地區的口音與表達方式,以在全球範圍提供在地化的語音體驗。
Google 強調效能與成本效率,透過 Flash 架構在盲測的人類評估基準上取得高分,同時降低運算成本——該架構旨在支援大規模的企業採用。生成的音訊包含 SynthID 水印,用於辨識由 AI 生成的內容並打擊錯誤資訊。
此舉反映語音介面競爭的加劇。OpenAI 正將即時語音功能與對話式 AI 結合,以實現類人互動;而 Meta 則擴大投資 AI 角色,並以語音為基礎的社交體驗來推動。產業觀察人士指出,儘管高水準的表演與創意工作或許仍將以人類主導為主,但重複性且規模化的製作市場,可能會在配音、廣告與有聲讀物等領域逐步導入 AI。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
A16z 最新報告:為什麼區塊鏈是 AI 代理缺少的那塊基礎建設?
a16z crypto 最新報告指出,AI agents 正從輔助工具演變為經濟行為者,然而在身份、支付和跨平台協作等核心基礎設施方面仍存在重大缺口。報告強調,隨著AI在治理和交易中的參與,驗證機制成為信任的關鍵,區塊鏈技術可提供可驗證的基礎設施來解決這些挑戰。未来需要透過加密機制來確保AI agents 真正代表使用者意志,並改變傳統支付系統。
鏈新聞abmedia22分鐘前
Moonshot AI 發布具強化程式碼與 Agent 能力的 Kimi K2.6
Moonshot AI 已發布 Kimi K2.6,提供在 kimi.com 上的聊天與 Agent 模式。它在程式碼基準測試中表現出色,支援 4,000 次工具呼叫,並升級平行功能以應對自主情境。
GateNews1小時前
Optiver 取得加密貨幣與 AI 聚焦 VC 公司的股權投資 Eden Block
Optiver Holding BV 已投資 Eden Block,這是一家專注於加密貨幣和 AI 的創投公司。此舉旨在提升 Optiver 在這些領域中對創新公司的曝險,因為這兩項技術都可能改變交易與資本市場。
GateNews2小時前
Cerebras 通過國家安全審查後重啟納斯達克 IPO,與阿聯宮(UAE)相關交易引發關注
Cerebras Systems 在通過與其關係相關的國家安全審查後,重新啟動其納斯達克 IPO 計劃。這家 AI 晶片製造商已使營收來源多元化,並在確保重大合作夥伴的同時,公布了顯著成長,將自己定位為英偉達(Nvidia)的競爭對手。
GateNews3小時前
OpenAI 將在未來幾週推出增強能力的新影像模型
Gate News 消息,4 月 20 日——根據報導,OpenAI 預計在未來幾週推出一個新的影像模型,能大幅提升生成複雜影像與圖表的能力。
GateNews3小時前
Kevin Warsh 成首位「Tech Bro」Fed 主席提名人:AI 樂觀派、持 SpaceX 與 Polymarket 股份
川普提名的Kevin Warsh成為首位「Tech Bro」Fed主席,與矽谷巨頭關係密切,並主張AI能降低通膨,支持寬鬆貨幣政策。他的矽谷背景可能影響Fed的利率決策,對加密市場預期正面,但也需注意利益衝突風險。其任命過程和未來政策走向將影響美元指數及台股估值。
鏈新聞abmedia3小時前