Alibaba Qwen3.7-Plus senkt die Preise um 80 %, um mit Closed Source gegen niedrigere Kosten einzutauschen

2026-06-03 05:14:01

Die Alibaba-Qwen-Serie veröffentlichte diese Woche das Modell Qwen3.7-Plus. Der Eingabepreis liegt bei 0,40 US-Dollar pro 1 Million Token, der Ausgabe-Preis bei 1,60 US-Dollar pro 1 Million Token; insgesamt 2,00 US-Dollar. Das entspricht einem Rückgang von bis zu 80 % gegenüber Qwen3.7-Max. Der Preis für gecachte Eingaben kann auf 0,04 US-Dollar pro 1 Million Token fallen. Das Ziel-Szenario sind hochfrequente, stark wiederkehrende Aufgaben.

Qwen3.7-Plus bestätigte Preise: Gebührenraten je Abrechnungsmodus

Laut den von Alibaba veröffentlichten Preisdaten:

Normaleingabe: 0,40 US-Dollar pro 1 Million Token

Normalausgabe: 1,60 US-Dollar pro 1 Million Token

Summe (Eingabe + Ausgabe): 2,00 US-Dollar

Gecachte Eingabe: 0,04 US-Dollar pro 1 Million Token (gilt für agent-basierte Szenarien für wiederholtes Lesen derselben Code-Bibliothek oder für Unternehmens-UI-Szenarien)

Vergleichsobjekt: Qwen3.7-Max: Eingabe 2,50 US-Dollar, Ausgabe 7,50 US-Dollar, insgesamt 10,00 US-Dollar. Chinesische Wettbewerber wie MiniMax-M3 bieten zeitlich begrenzt insgesamt 1,50 US-Dollar; die Preisgestaltung von Qwen3.7-Plus liegt eng daran.

Offizielle Benchmark-Testzahlen (Selbstauskunft)

Die folgenden Benchmark-Zahlen für Qwen3.7-Plus, die Alibaba offiziell veröffentlicht hat, sind allesamt Selbstauswertungsdaten:

Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max ist 67,9; Gemini-3.1 Pro ist 63,5)

ScreenSpot Pro (Computer Vision und Verständnis von Benutzeroberflächen): 79,0 (GPT-5.4 xhigh ist 67,4; Claude-Opus-4.6 ist 49,5）

Es ist zu beachten, dass Alibaba in den offiziellen Dokumenten zudem erklärt, dass die Gesamtleistung von Qwen3.7-Plus weiterhin unter der der meisten führenden US-amerikanischen Closed-Source-Modelle liegt. Die obigen Zahlen sind punktuelle Vergleiche für bestimmte Aufgaben und stehen nicht für eine umfassende Leistung.

Bestätigung der Closed-Source-Deployment-Auswirkungen: Compliance-Aspekte und Anwendungsgrenzen

Qwen3.7-Plus stellt keine herunterladbaren offenen Modellgewichte bereit. Alle API-Aufrufe müssen über die internationalen Knoten von Alibaba Cloud verarbeitet werden; die Daten fließen nicht außerhalb der Server des jeweiligen Nutzers. Aufgrund dieser Architektur gibt es klare Compliance-Hindernisse in folgenden Szenarien：

Industrien mit Einschränkungen durch Datenhoheit oder Vorschriften: Medizin (HIPAA, GDPR), Verteidigung, Regierungsbehörden—hier muss bewertet werden, ob die externe API-Routing-Route den Compliance-Anforderungen entspricht

Szenarien für isoliertes On-Premise-Netz: In vollständig isolierten lokalen Umgebungen ist ein Deployment nicht möglich

Im Gegenzug liegt der Vorteil im Closed-Source-API-Modell darin, dass kein eigenes Multi-GPU-Cluster aufgebaut werden muss (z. B. Hardwarebeschaffung und -wartung für Nvidia H100). Zudem minimiert das OpenAI-kompatible Format die Änderungsaufwände in bestehender Infrastruktur.

Häufige Fragen

Gilt der Cache-Preis von 0,04 US-Dollar pro 1 Million Token für Qwen3.7-Plus für welche Szenarien?

Der Cache-Preis gilt für agent-basierte Szenarien, in denen wiederholt dieselbe Eingabe gelesen wird, z. B. bei kontinuierlichem Zugriff auf dieselbe Code-Bibliothek, festen Unternehmens-UI-Templates oder lange beibehaltenen Systemprompts. In großen Workflows mit hoher Frequenz und Wiederholung kann der Cache-Mechanismus die gesamten API-Kosten deutlich senken. Alibaba hat keine konkreten Zusagen zur Cache-Trefferquote oder detaillierte Nutzungsbeschränkungen veröffentlicht.

Was sind die wichtigsten Unterschiede zwischen Qwen3.7-Plus und den früheren Qwen-Open-Source-Lizenzversionen?

Die früheren Qwen-Modelle wurden mit Apache-2.0-Lizenz veröffentlicht, inkl. herunterladbarer Modellgewichte. Das ermöglicht es jeder Person, sie lokal zu deployen, zu fine-tunen und in die eigenen Systeme zu integrieren. Qwen3.7-Plus wird nur über die Alibaba-Cloud-API bereitgestellt und veröffentlicht keine Modellgewichte. Das bedeutet, dass es nicht lokal oder in isolierten Netzwerken deployt werden kann; alle Nutzungen hängen von der externen Infrastruktur von Alibaba Cloud ab.

Wie ist die Vertrauenswürdigkeit der offiziellen Benchmark-Testzahlen von Qwen3.7-Plus zu interpretieren?

Die offiziellen Angaben zu Qwen3.7-Plus machen klar, dass das Laufen von Ratgebern wie Terminal Bench und ScreenSpot Pro sich um Selbstauswertungszahlen von Alibaba handelt und die Gesamtleistung weiterhin unter der der meisten führenden US-amerikanischen Closed-Source-Modelle liegt. Die Benchmark-Zahlen spiegeln die Einzelleistung in bestimmten Aufgaben wider und stehen nicht für End-to-End-Latenz, Stabilität oder eine umfassende Leistung in realen Produktionsumgebungen.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.