ElevenLabs dan Stability AI Meluncurkan Model Musik AI Baru dengan Data Berlisensi

ElevenLabs dan Stability AI merilis model baru untuk pembuatan musik berbasis AI minggu ini, keduanya menekankan data pelatihan berlisensi di tengah gugatan hak cipta yang sedang berlangsung di industri. ElevenLabs, perusahaan AI pengenalan suara asal Polandia yang valuasinya mencapai $11 miliar setelah pendanaan Seri D senilai $500 juta pada Februari, meluncurkan Music v2. Stability AI merilis Stable Audio 3.0, keluarga empat model dengan open weights untuk tiga varian yang menghasilkan trek hingga 6 menit 20 detik. Rilis ini menyusul gugatan hak cipta Recording Industry Association of America pada 2024 terhadap platform musik AI Suno dan Udio, sehingga data pelatihan berlisensi menjadi fokus utama bagi pendatang pasar baru. ElevenLabs menjalin perjanjian lisensi dengan Believe, Kobalt, dan Merlin, sementara Stability AI bermitra dengan Warner Music Group dan Universal Music Group. Suno, yang saat ini dinilai $2,45 miliar per November 2025, menembus $300 juta pendapatan tahunan berulang dan dipakai sekitar 100 juta orang, menghasilkan sekitar 7 juta lagu per hari.

Fitur ElevenLabs Music v2

Music v2 adalah model musik kedua dari ElevenLabs, hadir sekitar 10 bulan setelah versi pertama. Model ini dapat mengubah genre dalam satu trek—dari opera ke heavy metal lalu kembali—sambil mempertahankan koherensi komposisi. Menurut ElevenLabs, model ini menangani rap cepat serta menyematkan efek suara non-musikal tanpa membuat komposisi pecah.

Model ini menyertakan fungsionalitas inpainting, yang memungkinkan pengguna memilih dan mengenerate ulang bagian tertentu sambil membiarkan bagian lain dari trek tetap utuh. Pengguna dapat membangun lagu per bagian—intro, verse, chorus—dengan model menjaga kesinambungan sepanjang trek, alih-alih memperlakukan setiap klip sebagai generasi mandiri. Dukungan multibahasa membaik, meski ElevenLabs tidak memublikasikan detail spesifik.

Music v2 menggerakkan tiga platform: ElevenMusic untuk kreator, ElevenAPI untuk pengembang, dan ElevenCreative untuk brand. Model kini live di ElevenMusic dan ElevenCreative. Akses API tersedia melalui early entry lewat tim penjualan.

Penyesuaian Harga

ElevenLabs menurunkan harga Music v1 dan v2 hingga 50% untuk ElevenAPI dan hingga 40% untuk ElevenCreative self-serve. Perusahaan mencapai $500 juta pendapatan tahunan berulang pada April 2026. ElevenMusic diluncurkan sebagai aplikasi konsumen pada April.

Spesifikasi Teknis Stability AI Stable Audio 3.0

Stable Audio 3.0 hadir dengan empat model: Small SFX (efek suara pada perangkat), Small (komposisi musik penuh pada perangkat), Medium (hingga 6:20, diperlukan perangkat keras lebih kuat), dan Large (hanya API). Tiga dari empat model memiliki open weights yang tersedia di Hugging Face. Versi sebelumnya, Stable Audio 2.0, menghasilkan trek hingga tiga menit.

Model Small berjalan pada 459 juta parameter masing-masing tanpa memerlukan GPU. Medium beroperasi pada 1,4 miliar parameter dan menghasilkan output 6:20 dalam sekitar 1,31 detik di GPU H200. Large berjalan pada 2,7 miliar parameter dan hanya tersedia lewat API untuk organisasi dengan pendapatan di atas $1 juta. Model mendukung granularitas generasi per detik, menghasilkan trek pada panjang yang persis diminta.

Arsitektur menggunakan semantic-acoustic autoencoder yang Stability sebut SAME, dirancang untuk menjaga koherensi melodis pada output yang lebih panjang. Fine-tuning LoRA didukung, memungkinkan seniman menyesuaikan model dengan katalog mereka sendiri. Fungsionalitas inpainting mencakup single-segment, multi-segment, dan causal continuation untuk memperpanjang trek melewati batas awalnya. Model didukung di ComfyUI untuk pengaturan lokal.

Konteks Pasar dan Penyelesaian Hukum

Suno mencapai valuasi $2,45 miliar pada November 2025 dan menembus $300 juta pendapatan tahunan berulang. Warner Music menyelesaikan gugatannya terhadap Suno pada November 2025. Sony dan Universal Music Group tetap menjalani proses di pengadilan federal bersama Suno.

Udio menyelesaikan kesepakatan dengan ketiga label besar dan beroperasi sebagai walled garden—konten yang dihasilkan di platform tidak dapat diekspor.

Ketersediaan

Model Stable Audio 3.0 Small dan Medium tersedia di Hugging Face. Large live melalui API Stability AI. Music v2 gratis untuk pengguna ElevenMusic, dengan tier komersial tersedia melalui ElevenCreative dan ElevenAPI.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar