ByteDance stellt 3B Lance Multimodal-Modell Open-Source bereit, trainiert auf 128 A100-GPUs

Laut Beating hat ByteDance Research Lance Open Source gestellt: ein einheitliches multimodales Modell mit 3 Milliarden Parametern, das mit nur 128 A100-GPUs trainiert wurde. Lance unterstützt Bild- und Videoverständnis, -generierung und -bearbeitung in einem einzigen Framework und zeigt damit, dass fortschrittliche Multimodal-Fähigkeiten mit minimalen Rechenressourcen erreicht werden können, indem eine Dual-Stream-Mixture-of-Experts-Architektur und modalbewusstes rotary Position Encoding eingesetzt werden.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare