ElevenLabs und Stability AI bringen neue KI-Musikmodelle mit lizenzierten Daten auf den Markt

OliverGrant

2026-05-27 20:39:48

ElevenLabs und Stability AI haben diese Woche neue KI-Musik-Generierungsmodelle veröffentlicht, beide mit Fokus auf lizenzierte Trainingsdaten angesichts laufender Urheberrechtsstreitigkeiten in der Branche. ElevenLabs, das in Polen gegründete Voice-AI-Unternehmen mit einer Bewertung von 11 Milliarden US-Dollar nach einer 500 Millionen US-Dollar Series D im Februar, brachte Music v2 auf den Markt. Stability AI veröffentlichte Stable Audio 3.0, eine Vier-Modell-Familie mit offenen Gewichten für drei Varianten, die Tracks mit einer Länge von bis zu sechs Minuten und zwanzig Sekunden erzeugt. Die Veröffentlichungen folgen auf Urheberrechtsklagen der Recording Industry Association of America aus dem Jahr 2024 gegen KI-Musikplattformen Suno und Udio, wodurch lizenzierte Trainingsdaten für neue Markteinsteiger zum zentralen Thema wurden. ElevenLabs schloss Lizenzvereinbarungen mit Believe, Kobalt und Merlin, während Stability AI mit Warner Music Group und Universal Music Group zusammenarbeitete. Suno, derzeit mit 2,45 Milliarden US-Dollar bewertet (Stand November 2025), überschritt 300 Millionen US-Dollar Umsatz in jährlichen wiederkehrenden Einnahmen und wurde von etwa 100 Millionen Menschen genutzt; dabei werden rund 7 Millionen Songs pro Tag generiert.

ElevenLabs Music v2 Features

Music v2 ist das zweite Musikmodell von ElevenLabs und erscheint etwa 10 Monate nach der ersten Version. Das Modell kann Genres innerhalb eines einzelnen Tracks wechseln – von Oper bis Heavy Metal und zurück – und dabei die kompositorische Kohärenz beibehalten. Laut ElevenLabs verarbeitet das Modell schnelles Rapming und bettet nicht-musikalische Soundeffekte ein, ohne dass die Komposition auseinanderbricht.

Das Modell umfasst Inpainting-Funktionalität, sodass Nutzer bestimmte Abschnitte auswählen und neu generieren können, während der Rest des Tracks unangetastet bleibt. Nutzer können Songs abschnittsweise aufbauen – Intro, Verse, Chorus – wobei das Modell die Kontinuität durchgehend beibehält, statt jeden Clip als eigenständige Generierung zu behandeln. Die Unterstützung für mehrere Sprachen wurde verbessert, doch ElevenLabs veröffentlichte keine spezifischen Details.

Music v2 treibt drei Plattformen an: ElevenMusic für Creator, ElevenAPI für Entwickler und ElevenCreative für Brands. Das Modell ist jetzt live auf ElevenMusic und ElevenCreative. API-Zugriff ist über einen Early-Entry-Weg via das Vertriebsteam verfügbar.

Pricing Adjustments

ElevenLabs senkte die Preise für Music v1 und v2 um bis zu 50% für ElevenAPI und um bis zu 40% für ElevenCreative Self-serve. Das Unternehmen erreichte im April 2026 500 Millionen US-Dollar Umsatz in jährlichen wiederkehrenden Einnahmen. ElevenMusic startete im April als Consumer-App.

Stability AI Stable Audio 3.0 Technical Specifications

Stable Audio 3.0 wird mit vier Modellen ausgeliefert: Small SFX (Soundeffekte auf dem Gerät), Small (vollständige Musikkomposition auf dem Gerät), Medium (bis zu 6:20, stärkere Hardware erforderlich) und Large (nur API). Drei der vier Modelle haben offene Gewichte, die auf Hugging Face verfügbar sind. Die vorherige Version, Stable Audio 2.0, generierte Tracks mit einer Länge von bis zu drei Minuten.

Die Small-Modelle laufen mit jeweils 459 Millionen Parametern, ohne dass eine GPU erforderlich ist. Medium arbeitet mit 1,4 Milliarden Parametern und erzeugt seine 6:20-Ausgabe in etwa 1,31 Sekunden auf einer H200-GPU. Large läuft mit 2,7 Milliarden Parametern und ist nur über eine API verfügbar – für Organisationen mit mehr als 1 Million US-Dollar Umsatz. Die Modelle unterstützen Generierungs-Granularität pro Sekunde und erzeugen Tracks in exakt der angeforderten Länge.

Die Architektur nutzt einen semantisch-akustischen Autoencoder, den Stability SAME nennt, der darauf ausgelegt ist, melodische Kohärenz über längere Ausgaben hinweg zu erhalten. LoRA-Fine-Tuning wird unterstützt, sodass Artists die Modelle an ihre eigenen Kataloge anpassen können. Die Inpainting-Funktionalität umfasst Single-Segment, Multi-Segment und Causales Fortführen, um Tracks über ihren ursprünglichen Endpunkt hinaus zu verlängern. Die Modelle werden in ComfyUI für lokale Setups unterstützt.

Market Context and Legal Settlements

Suno erreichte im November 2025 eine Bewertung von 2,45 Milliarden US-Dollar und überschritt 300 Millionen US-Dollar Umsatz in jährlichen wiederkehrenden Einnahmen. Warner Music einigte sich im November 2025 mit Suno. Sony und Universal Music Group bleiben in bundesstaatlichen Gerichtsverfahren mit Suno.

Udio einigte sich mit allen drei großen Labels und arbeitet als „walled garden“ – Inhalte, die auf der Plattform generiert werden, können nicht exportiert werden.

Availability

Stable Audio 3.0 Small- und Medium-Modelle sind auf Hugging Face verfügbar. Large ist über die Stability-AI-API live. Music v2 ist für ElevenMusic-Nutzer kostenlos, kommerzielle Stufen sind über ElevenCreative und ElevenAPI verfügbar.

View Source

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.