bytedaily
Kamis, 21 Mei 2026 - 02:14 WIB

Stability AI Rilis Model Audio Generasi Baru, Mampu Ciptakan Lagu Hingga 6 Menit

Redaksi 20 Mei 2026 4 views
Stability AI Rilis Model Audio Generasi Baru, Mampu Ciptakan Lagu Hingga 6 Menit
Ilustrasi visual (Sumber: techcrunch.com)

bytedaily - Dilansir dari techcrunch.com, Stability AI, perusahaan di balik Stable Diffusion, meluncurkan keluarga model audio baru bernama Stability Audio 3.0. Model teratasnya diklaim mampu menghasilkan musik berkualitas profesional dengan durasi lebih dari enam menit.

Perusahaan merilis empat model baru di bawah nama Stable Audio 3.0, yaitu SFX kecil (459 juta parameter), kecil (459 juta parameter), medium (1,4 miliar parameter), dan besar (2,7 miliar parameter). Dua model kecil dirancang untuk pembuatan suara dan musik di perangkat dengan durasi hingga dua menit.

Model medium dan besar dapat menciptakan komposisi penuh berdurasi 6 menit 20 detik yang mampu mempertahankan struktur musik dan nada melodi. Durasi ini lebih dari dua kali lipat dibandingkan kemampuan Stable Audio 2.0 yang dirilis pada tahun 2024.

Stability AI menyediakan model SFX kecil, kecil, dan medium dengan bobot terbuka agar dapat digunakan dan dimodifikasi oleh siapa saja. Pada tahun 2024, perusahaan telah merilis Stable Audio Open yang memungkinkan pembuatan musik hingga 47 detik. Keluarga model baru ini merupakan peningkatan signifikan dari versi terbuka sebelumnya.

Model besar hanya tersedia melalui API dan layanan berbayar self-hosting. Selain itu, perusahaan dengan pendapatan lebih dari 1 juta dolar AS akan memerlukan lisensi perusahaan.

Banyak perusahaan, termasuk Google dan ElevenLabs, turut merilis model dan perangkat pendukung untuk generasi musik. Namun, sebagaimana terbukti dari sengketa hukum yang sedang berlangsung antara Suno dan Udio, lisensi data serta kemitraan dengan label musik dapat menjadi bagian krusial bagi kelangsungan jangka panjang layanan ini.

Tahun lalu, Stability AI menjalin kesepakatan dengan Warner Music Group dan Universal Music Group untuk mengembangkan model dan alat kreasi musik. Perusahaan menyatakan bahwa rangkaian model audio terbarunya dibangun di atas data yang sepenuhnya berlisensi.

Startup AI ini sedang mengembangkan rangkaian produk baru untuk musisi profesional, namun belum memberikan detail lebih lanjut mengenai fiturnya. Ethan Kaplan, mantan chief digital officer di Universal Audio dan Fender, bergabung dengan perusahaan untuk memimpin penawaran musik profesional Stability.

Sejumlah perusahaan AI berupaya meningkatkan kredibilitas mereka dengan merekrut eksekutif musik. Awal tahun ini, Suno mempekerjakan mantan CEO Merlin, Jeremy Sirota, sebagai chief commercial officer. ElevenLabs juga merekrut Derek Cournoyer dari penerbit musik independen Kobalt sebagai strategi lead untuk bisnis musiknya.


Sumber asli: Artikel ini disadur dari publikasi techcrunch.com.