Alibaba Cloud kündigte am 20. Mai 2026 auf dem Alibaba Cloud Summit ein umfassendes Upgrade seines Full-Stack-Technologiesystems an und positioniert sich damit für das Zeitalter der Agentic AI. Das Unternehmen führte neue Produkte ein, darunter die Qwen-Cloud-Produktwebsite, den selbst entwickelten KI-Chip Pangu M890, der in den Panjiu-AL128-Supernode-Server integriert ist, sowie das Flaggschiff-Modell Qwen3.7-Max. Diese Entwicklung spiegelt eine grundlegende Veränderung der primären Nutzer von Cloud Computing wider: Da KI-Agenten rund um die Uhr kontinuierlich arbeiten, bei unendlicher KI- und Cloud-Nachfrage, strukturiert Alibaba Cloud seinen gesamten Technologie-Stack neu – von der Bottom-Layer-Chip-Ebene über Agentic-Cloud-Infrastruktur, Modelle bis hin zu Inferenzplattformen. Laut Unternehmensführung soll Token-basierter KI-Umsatz in Kürze die ECS (Elastic Compute Service) als größte Produktlinie von Alibaba Cloud ablösen – ein Übergang von traditionellen Cloud-Services zu AI-getriebenen Konsummodellen. In den vergangenen fünf Monaten ist der tägliche Durchschnittsumsatz aus Tokens von Alibaba Cloud um etwa das 15-Fache gestiegen, was die Beschleunigung dieser Transformation signalisiert.

Pangu-KI-Chipsserie und Hardware-Infrastruktur

Alibaba Cloud veröffentlichte eine aggressive Chip-Roadmap mit Fokus auf den Pangu M890, einen Next-Generation-Trainings- und Inferenz-vereinten KI-Chip mit einer dreifach besseren Performance als die vorherige Generation Pangu M810E. Der Panjiu-AL128-Supernode-Server, angetrieben vom M890 und ausgestattet mit dem selbst entwickelten ICN-Switch-1.0-Interconnect-Chip, ermöglicht es, 128 KI-Chips als eine einzige Recheneinheit arbeiten zu lassen, mit Peer-to-Peer-Latenzen von unter 150 Nanosekunden. Damit adressiert er massenhaft parallele Inferenz und große Anforderungen an das Training großer Modelle in Agent-Szenarien.

Alibaba Cloud legte die Roadmap der Pangu-Chipserie offen und verpflichtete sich, in den nächsten zwei Jahren jährlich eine neue Generation zu veröffentlichen. Geplant sind Releases der Pangu V900- und Pangu J900-Chips, die eine erhöhte Rechenleistung bieten. Bis heute wurden aus der Pangu-Serie kumuliert 560.000 Chips ausgeliefert, die über 400 Kunden in mehr als 20 Branchen bedienen.

Token-Umsatzwachstum und Marktposition

Alibaba Cloud hält den größten Anteil im Markt für große Modelle MaaS (Model-as-a-Service). Das Unternehmen berichtete, dass der Token-Umsatz in diesem Jahr deutlich beschleunigt anstieg, wobei die vorherige Phase als lediglich ein „Prolog“ beschrieben wurde. Laut Unternehmensführung stieg der tägliche Durchschnitts-Token-Umsatz in den vergangenen fünf Monaten um etwa das 15-Fache, was die schnelle Verbreitung von KI-Services widerspiegelt. Diese Wachstumskurve zeigt, dass tokenbasierte Kennzahlen zur primären Maßeinheit für die Umsatzexpansion von Alibaba Cloud werden.

Cloud-Produktneudesign für Agent-Workloads

Alibaba Cloud gestaltet seine Cloud-Produkte grundsätzlich neu, sodass sie als agent-native Systeme funktionieren. Traditionelle Cloud-Produkte wurden für menschliche Operatoren entworfen, doch Agent-Workloads weisen Eigenschaften auf, die mit herkömmlichem Cloud Computing nicht kompatibel sind: unregelmäßige Elastizität, kurze Lebenszyklen und eine sofortige Skalierung. Das Unternehmen hat Skill-ification, MCP (Model Context Protocol)-Transformation und CLI (Command Line Interface)-Standardisierung aller Cloud-Produkte umgesetzt, wodurch Agents Cloud-Fähigkeiten als standardisierte Funktionsaufrufe nutzen können.

Diese Neugestaltungsphilosophie veranlasste Alibaba Cloud, Qwen Cloud zu starten – eine neue Produktwebsite, getrennt vom Haupt-Portal von Alibaba Cloud. Die Startseite der Website zeigt eine einzige agentenlesbare Prompt-Anweisung. Alle Modellservice-Fähigkeiten sind in standardisierte Skills und CLI-Tools gekapselt. So können Agents die Anweisung analysieren, die vollständigen Plattformfähigkeiten erlangen und die benötigten Funktionen autonom aufrufen. Laut Führungskräften des Unternehmens liegt der Kernschluss hinter dieser Initiative darin, dass die künftigen Hauptnutzer des Cloud Computing nicht menschliche Ingenieure, sondern KI-Agenten sein werden. Das macht eine grundlegende Verschiebung in der Produktarchitektur und im Interaction Design erforderlich.

Qwen3.7-Max-Modellfähigkeiten und Performance

Alibaba Cloud veröffentlichte Qwen3.7-Max als sein neuestes Flaggschiff für Large Language Models. In den Arena-Rankings für globale Large-Model-Blindtests belegt Qwen3.7-Max den ersten Platz unter den chinesischen Modellen und liegt damit vor Kimi-K2.6, DeepSeek-v4-pro und GLM-5.1. Gleichzeitig kommt es an die Performance-Niveaus der stärksten Modelle von GPT, Claude und Gemini heran.

Eine Fallstudie aus der Produktion zeigt die autonome Leistungsfähigkeit des Modells über standardmäßige Benchmarks hinaus. Auf dem Pangu-M890-Chip – einer Plattform, die das Modell während des Trainings noch nie begegnet war – schloss Qwen3.7-Max selbstständig eine produktionsreife Implementierungs- und Optimierungsaufgabe für einen KI-Compute-Kernel über 35 Stunden ab, wobei nur eine Aufgabenbeschreibung genutzt wurde. Dabei erreichte es die 10-fache Performance der offiziellen Referenzversion. Dieses Beispiel verdeutlicht eine grundlegende Verschiebung der Zielsetzung im Modell-Design: weg von der Optimierung für Human-Preference-Alignment hin zur Optimierung für autonomes Abarbeiten von Aufgaben. Laut der Führung der Abteilung Large Models bei Alibaba wurde Qwen3.7-Max so konzipiert, dass es als intelligente Kernkomponente für Agenten dient – ausgestattet mit autonomer Planung, kontinuierlicher Iteration und Fähigkeiten zur Zusammenarbeit über mehrere Tools hinweg.

Alibaba Cloud hat AI Coding (AI-getriebenes Programmieren) als primären Anwendungsbereich identifiziert. Das Unternehmen weist darauf hin, dass AI Coding neue Anwendungen erzeugt und zugleich Legacy-Code modernisiert, der sich über Jahrzehnte angesammelt hat. Unternehmensvertreter hoben hervor, dass AI Coding auf Softwareentwicklung und externe Outsourcing-Ausgaben abzielt, die zuvor außerhalb der Erfassung von Umsätzen traditioneller Cloud-Services lagen. Das stelle eine bedeutende Erweiterung der adressierbaren Marktchancen dar.

View Source

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.