Stability AI, yayınladığı bir blog yazısında Stable Audio Open'ı tanıtarak, aracın tamamen telifsiz müzik üzerine eğitildiğini ve bir metin açıklamasını alıp 47 saniyeye kadar uzunlukta bir kayda dönüştürebildiğini söyledi. Stable Audio Open, şirketin ilk olarak eylül ayında piyasaya sürülen ticari metinden ses oluşturma aracı Stable Audio'ya dayanıyor. Şirket nisan ayında Stable Audio 2.0 aracını geliştirerek ses çıkışlarına daha fazla netlik kazandırmış ve seslerin uzunluklarını artırmıştı.
Telif hakkıyla korunan müzik kaynakları üzerinde eğitilen bu modelin aksine, Stable Audio Open yalnızca Free Music Archive ve FreeSound gibi ücretsiz müzik kütüphanelerinden 486 bin örnek üzerinde eğitildi, bu nedenle kayıtların aynı kalitede olması pek olası değil.
Stability AI, davul ritimleri, enstrüman riff'leri, ortam sesleri ve prodüksiyon öğeleri oluşturması gereken müzisyenler ve film yapımcıları için tasarlandığını söyledi. Ayrıca araç mevcut şarkıları da düzenleyebiliyor ya da farklı tarzdaki bir şarkıya smooth jazz gibi yeni bir tarz uygulayabiliyor. Stable Audio Open'ın ilginç bir avantajı da kullanıcıların kendi sesleriyle modele ince ayar yapabilmeleri, yani bir müzisyen kendi tarzında yeni sesler üretmek için kendi davul kayıtlarından veya gitar riff'lerinden örnekler yükleyebiliyor.
Ancak Stable Audio Open'ın açık yapısı kullanışlılığını bir dereceye kadar sınırlıyor. Şirket, modelin amacının tam şarkılar oluşturmak değil, müzikal efekt olarak kullanılabilecek daha kısa ses baytları oluşturmak olduğunu açıklıyor. Araç, uzun bir şarkı ya da vokal üretemiyor. Bunu yapmak isteyenlerin, üç dakikadan daha uzun ve daha tutarlı müzik üretebilen premium Stable Audio 2.0 hizmetini veya Suno platformu gibi bir alternatifi kullanmaları daha iyi olacaktır diyebiliriz.
Stability AI ayrıca modelin, insanlar İngilizce dışındaki dillerde komut verdiğinde çok iyi performans göstermediğini kabul ediyor.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap