阿里 Qwen3.7-Plus 定价砍 80%,以闭源换低成本

Qwen3.7-Plus降價

阿里巴巴千問(Qwen)系列本週發布 Qwen3.7-Plus 模型,輸入定價 0.40 美元/百萬 token、輸出 1.60 美元/百萬 token,合計 2.00 美元,較 Qwen3.7-Max 降幅達 80%;快取輸入定價可低至 0.04 美元/百萬 token,目標場景為高頻重複性任務。

Qwen3.7-Plus 確認定價:各計費模式費率

依據阿里官方發布的定價資料:

一般輸入:0.40 美元/百萬 token

一般輸出:1.60 美元/百萬 token

合計(輸入+輸出):2.00 美元

快取輸入:0.04 美元/百萬 token(適用於重複讀取相同程式碼庫或企業 UI 的 agent 場景)

對照對象:Qwen3.7-Max 輸入 2.50 美元、輸出 7.50 美元,合計 10.00 美元。中國同業競爭者 MiniMax-M3 限時優惠合計 1.50 美元,Qwen3.7-Plus 定價緊貼其上。

官方基準測試數字(官方自評)

以下為阿里官方公布的 Qwen3.7-Plus 基準測試數字,均屬自評數據:

Terminal Bench 2.0-Terminus:70.3(DeepSeek-V4-Pro Max 為 67.9、Gemini-3.1 Pro 為 63.5)

ScreenSpot Pro(電腦視覺與介面理解):79.0(GPT-5.4 xhigh 為 67.4、Claude-Opus-4.6 為 49.5)

值得注意的是,阿里官方文件亦說明,Qwen3.7-Plus 整體表現仍低於多數領先的美國閉源模型,上述數字為特定任務的單點比較,不代表全面表現。

閉源部署的確認影響:合規考量與適用限制

Qwen3.7-Plus 不提供可下載的開放模型權重,所有 API 呼叫均需經由阿里雲國際節點處理,數據在用戶自身伺服器以外流動。依據此架構,以下情境存在明確的合規障礙:

受資料主權或法規限制的產業:醫療(HIPAA、GDPR)、國防、政府機關,需評估外部 API 路由是否符合合規要求

內網隔離部署場景:無法在完全隔離的本地環境中部署

反之,閉源 API 模式的優勢在於無需自建多 GPU 叢集(如 Nvidia H100)的硬體採購與維運,且 OpenAI 相容格式使現有基礎設施的改動成本最小化。

常見問題

Qwen3.7-Plus 的快取定價 0.04 美元/百萬 token 適用於哪些場景?

快取定價適用於 agent 反覆讀取相同輸入的場景,例如持續訪問同一份程式碼庫、固定的企業 UI 模板或長時間保持的系統提示。在高頻、重複性任務的大型工作流中,快取機制可大幅降低整體 API 成本。Alibaba 未公布快取命中率的具體保證或使用限制細節。

Qwen3.7-Plus 與此前 Qwen 開放授權版本的主要差異是什麼?

此前的 Qwen 系列以 Apache 2.0 授權發布可下載的模型權重,允許任何人本地部署、微調和整合至自有系統。Qwen3.7-Plus 僅透過阿里雲 API 提供,不發布模型權重,意味著無法在本地或隔離網路中部署,所有使用均依賴阿里雲的外部基礎設施。

Qwen3.7-Plus 的官方基準測試數字的可信度應如何解讀?

Qwen3.7-Plus 的官方說明明確指出,Terminal Bench 和 ScreenSpot Pro 等跑分為阿里官方自評數字,且整體表現仍低於多數領先的美國閉源模型。基準測試數字反映特定任務下的單點性能,不代表實際生產環境中的端到端延遲、穩定性或全面表現。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论