Alibaba stellt Open-Source-AgenticQwen-Modell vor: 8B-Version kommt mit Dual-Data-Flywheels an 235B-Leistung heran

Gate News-Meldung, 27. April — Das PAI-Team von Alibaba hat AgenticQwen veröffentlicht und Open Source gestellt: ein kleinformatiges agentisches Sprachmodell, das für Tool-Calling-Anwendungen in Industriequalität entwickelt wurde. Das Modell gibt es in zwei Versionen: 8B und 30B-A3B. Trainiert über ein innovatives „Dual-Data-Flywheel“-Verstärkungslern-Framework erreicht AgenticQwen agentische Fähigkeiten auf Modell-Ebene in der Nähe von Billion-Parameter-Modellen, während die Inferenzkosten deutlich gesenkt werden.

Der Dual-Data-Flywheel-Mechanismus löst das Homogenisierungsproblem bei traditioneller synthetischer Datenaufbereitung. Das Reasoning-Flywheel generiert automatisch schwierigere Varianten aus Modellfehlern, während das agentische Flywheel einfache lineare Workflows (wie Single-Booking-Prozesse) in Multi-Branch-Behavior-Trees mit Constraints, Ablehnungen und adversarialen Bedingungen erweitert und so komplexe Entscheidungs-szenarien aus der realen Welt simuliert. Benchmarks zeigen, dass AgenticQwen-8B 47,4 auf realen Tool-Umgebungsbenchmarks (TAU-2 und BFCL-V4) erzielte und damit die Basis Qwen3-8B (23,8) deutlich übertraf sowie an Qwen3-235B (52,0) herankam. AgenticQwen-30B-A3B (mit nur 3B aktivierten Parametern) erreichte 50,2.

Das Modell wurde in internen Produktionssystemen ähnlich wie Manus eingesetzt und verkleinert die Lücke zu 235B-Modellen bei End-to-End-Inferenzzeit deutlich. Allerdings ist das Modell durch eine native Kontextlänge von 40K Tokens begrenzt, was seine Leistung bei Deep-Search-Aufgaben einschränkt.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare