阿里 Qwen3.7-Plus 定价砍 80%，以闭源换低成本

2026-06-03 05:14:01

阿里巴巴千問（Qwen）系列本週發布 Qwen3.7-Plus 模型，輸入定價 0.40 美元/百萬 token、輸出 1.60 美元/百萬 token，合計 2.00 美元，較 Qwen3.7-Max 降幅達 80%；快取輸入定價可低至 0.04 美元/百萬 token，目標場景為高頻重複性任務。

Qwen3.7-Plus 確認定價：各計費模式費率

依據阿里官方發布的定價資料：

一般輸入：0.40 美元/百萬 token

一般輸出：1.60 美元/百萬 token

合計（輸入＋輸出）：2.00 美元

快取輸入：0.04 美元/百萬 token（適用於重複讀取相同程式碼庫或企業 UI 的 agent 場景）

對照對象：Qwen3.7-Max 輸入 2.50 美元、輸出 7.50 美元，合計 10.00 美元。中國同業競爭者 MiniMax-M3 限時優惠合計 1.50 美元，Qwen3.7-Plus 定價緊貼其上。

官方基準測試數字（官方自評）

以下為阿里官方公布的 Qwen3.7-Plus 基準測試數字，均屬自評數據：

Terminal Bench 2.0-Terminus：70.3（DeepSeek-V4-Pro Max 為 67.9、Gemini-3.1 Pro 為 63.5）

ScreenSpot Pro（電腦視覺與介面理解）：79.0（GPT-5.4 xhigh 為 67.4、Claude-Opus-4.6 為 49.5）

值得注意的是，阿里官方文件亦說明，Qwen3.7-Plus 整體表現仍低於多數領先的美國閉源模型，上述數字為特定任務的單點比較，不代表全面表現。

閉源部署的確認影響：合規考量與適用限制

Qwen3.7-Plus 不提供可下載的開放模型權重，所有 API 呼叫均需經由阿里雲國際節點處理，數據在用戶自身伺服器以外流動。依據此架構，以下情境存在明確的合規障礙：

受資料主權或法規限制的產業：醫療（HIPAA、GDPR）、國防、政府機關，需評估外部 API 路由是否符合合規要求

內網隔離部署場景：無法在完全隔離的本地環境中部署

反之，閉源 API 模式的優勢在於無需自建多 GPU 叢集（如 Nvidia H100）的硬體採購與維運，且 OpenAI 相容格式使現有基礎設施的改動成本最小化。

常見問題

Qwen3.7-Plus 的快取定價 0.04 美元/百萬 token 適用於哪些場景？

快取定價適用於 agent 反覆讀取相同輸入的場景，例如持續訪問同一份程式碼庫、固定的企業 UI 模板或長時間保持的系統提示。在高頻、重複性任務的大型工作流中，快取機制可大幅降低整體 API 成本。Alibaba 未公布快取命中率的具體保證或使用限制細節。

Qwen3.7-Plus 與此前 Qwen 開放授權版本的主要差異是什麼？

此前的 Qwen 系列以 Apache 2.0 授權發布可下載的模型權重，允許任何人本地部署、微調和整合至自有系統。Qwen3.7-Plus 僅透過阿里雲 API 提供，不發布模型權重，意味著無法在本地或隔離網路中部署，所有使用均依賴阿里雲的外部基礎設施。

Qwen3.7-Plus 的官方基準測試數字的可信度應如何解讀？

Qwen3.7-Plus 的官方說明明確指出，Terminal Bench 和 ScreenSpot Pro 等跑分為阿里官方自評數字，且整體表現仍低於多數領先的美國閉源模型。基準測試數字反映特定任務下的單點性能，不代表實際生產環境中的端到端延遲、穩定性或全面表現。

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。