Gate News Nachricht, 30. März, Ali Qianwen hat das vollmodale Sprachmodell Qwen3.5-Omni offiziell eingeführt. Die Serie umfasst Instruct-Versionen in drei Größen: Plus, Flash und Light, unterstützt einen langen Kontext von 256k (lange Eingänge und lange Ausgaben) und ermöglicht Audioeingaben von mehr als 10 Stunden sowie Video- und Audioeingaben von mehr als 400 Sekunden in 720P (1FPS). Das Modell wurde nativen multimodalen Vortraining auf riesigen Text-, Bild- sowie Audio- und Videodaten von über 1 Milliarde Stunden unterzogen und zeigt herausragende Fähigkeiten in der ganzheitlichen Wahrnehmung und Generierung von Multimodalität. Im Vergleich zum Vorgänger Qwen3-Omni wurde die mehrsprachige Fähigkeit von Qwen3.5-Omni deutlich verbessert; es kann Spracherkennung in 113 Sprachen und Dialekten sowie Sprachgenerierung in 36 Sprachen und Dialekten unterstützen.