
Die Alibaba-Qwen-Serie veröffentlichte diese Woche das Modell Qwen3.7-Plus. Der Eingabepreis liegt bei 0,40 US-Dollar pro 1 Million Token, der Ausgabe-Preis bei 1,60 US-Dollar pro 1 Million Token; insgesamt 2,00 US-Dollar. Das entspricht einem Rückgang von bis zu 80 % gegenüber Qwen3.7-Max. Der Preis für gecachte Eingaben kann auf 0,04 US-Dollar pro 1 Million Token fallen. Das Ziel-Szenario sind hochfrequente, stark wiederkehrende Aufgaben.
Qwen3.7-Plus bestätigte Preise: Gebührenraten je Abrechnungsmodus
Laut den von Alibaba veröffentlichten Preisdaten:
Normaleingabe: 0,40 US-Dollar pro 1 Million Token
Normalausgabe: 1,60 US-Dollar pro 1 Million Token
Summe (Eingabe + Ausgabe): 2,00 US-Dollar
Gecachte Eingabe: 0,04 US-Dollar pro 1 Million Token (gilt für agent-basierte Szenarien für wiederholtes Lesen derselben Code-Bibliothek oder für Unternehmens-UI-Szenarien)
Vergleichsobjekt: Qwen3.7-Max: Eingabe 2,50 US-Dollar, Ausgabe 7,50 US-Dollar, insgesamt 10,00 US-Dollar. Chinesische Wettbewerber wie MiniMax-M3 bieten zeitlich begrenzt insgesamt 1,50 US-Dollar; die Preisgestaltung von Qwen3.7-Plus liegt eng daran.
Offizielle Benchmark-Testzahlen (Selbstauskunft)
Die folgenden Benchmark-Zahlen für Qwen3.7-Plus, die Alibaba offiziell veröffentlicht hat, sind allesamt Selbstauswertungsdaten:
Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max ist 67,9; Gemini-3.1 Pro ist 63,5)
ScreenSpot Pro (Computer Vision und Verständnis von Benutzeroberflächen): 79,0 (GPT-5.4 xhigh ist 67,4; Claude-Opus-4.6 ist 49,5)
Es ist zu beachten, dass Alibaba in den offiziellen Dokumenten zudem erklärt, dass die Gesamtleistung von Qwen3.7-Plus weiterhin unter der der meisten führenden US-amerikanischen Closed-Source-Modelle liegt. Die obigen Zahlen sind punktuelle Vergleiche für bestimmte Aufgaben und stehen nicht für eine umfassende Leistung.
Bestätigung der Closed-Source-Deployment-Auswirkungen: Compliance-Aspekte und Anwendungsgrenzen
Qwen3.7-Plus stellt keine herunterladbaren offenen Modellgewichte bereit. Alle API-Aufrufe müssen über die internationalen Knoten von Alibaba Cloud verarbeitet werden; die Daten fließen nicht außerhalb der Server des jeweiligen Nutzers. Aufgrund dieser Architektur gibt es klare Compliance-Hindernisse in folgenden Szenarien:
Industrien mit Einschränkungen durch Datenhoheit oder Vorschriften: Medizin (HIPAA, GDPR), Verteidigung, Regierungsbehörden—hier muss bewertet werden, ob die externe API-Routing-Route den Compliance-Anforderungen entspricht
Szenarien für isoliertes On-Premise-Netz: In vollständig isolierten lokalen Umgebungen ist ein Deployment nicht möglich
Im Gegenzug liegt der Vorteil im Closed-Source-API-Modell darin, dass kein eigenes Multi-GPU-Cluster aufgebaut werden muss (z. B. Hardwarebeschaffung und -wartung für Nvidia H100). Zudem minimiert das OpenAI-kompatible Format die Änderungsaufwände in bestehender Infrastruktur.
Häufige Fragen
Gilt der Cache-Preis von 0,04 US-Dollar pro 1 Million Token für Qwen3.7-Plus für welche Szenarien?
Der Cache-Preis gilt für agent-basierte Szenarien, in denen wiederholt dieselbe Eingabe gelesen wird, z. B. bei kontinuierlichem Zugriff auf dieselbe Code-Bibliothek, festen Unternehmens-UI-Templates oder lange beibehaltenen Systemprompts. In großen Workflows mit hoher Frequenz und Wiederholung kann der Cache-Mechanismus die gesamten API-Kosten deutlich senken. Alibaba hat keine konkreten Zusagen zur Cache-Trefferquote oder detaillierte Nutzungsbeschränkungen veröffentlicht.
Was sind die wichtigsten Unterschiede zwischen Qwen3.7-Plus und den früheren Qwen-Open-Source-Lizenzversionen?
Die früheren Qwen-Modelle wurden mit Apache-2.0-Lizenz veröffentlicht, inkl. herunterladbarer Modellgewichte. Das ermöglicht es jeder Person, sie lokal zu deployen, zu fine-tunen und in die eigenen Systeme zu integrieren. Qwen3.7-Plus wird nur über die Alibaba-Cloud-API bereitgestellt und veröffentlicht keine Modellgewichte. Das bedeutet, dass es nicht lokal oder in isolierten Netzwerken deployt werden kann; alle Nutzungen hängen von der externen Infrastruktur von Alibaba Cloud ab.
Wie ist die Vertrauenswürdigkeit der offiziellen Benchmark-Testzahlen von Qwen3.7-Plus zu interpretieren?
Die offiziellen Angaben zu Qwen3.7-Plus machen klar, dass das Laufen von Ratgebern wie Terminal Bench und ScreenSpot Pro sich um Selbstauswertungszahlen von Alibaba handelt und die Gesamtleistung weiterhin unter der der meisten führenden US-amerikanischen Closed-Source-Modelle liegt. Die Benchmark-Zahlen spiegeln die Einzelleistung in bestimmten Aufgaben wider und stehen nicht für End-to-End-Latenz, Stabilität oder eine umfassende Leistung in realen Produktionsumgebungen.