Meta, metinsel komutlarla müzik üretimi ve ses üretimi gerçekleştiren açık kaynaklı yapay zeka aracı AudioCraft'ı tanıttı. AudioGen, EnCodec ve MusicGen olmak üzere 3 farklı modele ev sahipliği yapan AudioCraft, müzik, ses, sıkıştırma ve üretim için çalışıyor.
AudioGen ve MusicGen sırasıyla ses efektleri ve müzik üretirken, EnCodec daha yüksek kaliteli sonuçlar üretmek için sesleri sıkıştırıyor. Geliştiriciler, AudioCraft kodunun tamamına ve model ağırlıklandırmasına erişebilecek.
Meta'nın aracı açık kaynak olarak yayınlaması, profesyonellere ve araştırmacılara kendi verilerini kullanarak modelleri eğitme şansı veriyor. Önceden eğitilmiş tüm modeller ya kamuya açık ya da Meta'ya ait materyalleri kullanıyor, bu nedenle şirket, telif hakkı anlaşmazlığının yaşanmayacağını ifade ediyor. Örneğin, bu modeller arasında MusicGen, şirkete ait olan lisanslı müzikler üzerinde eğitildi.
Öte yandan sanatçılar ve müzik endüstrisinin önde gelen isimleri, telif hakları ihlalleri konusunda endişelerini dile getirdi. Zira bahsi geçen makine öğrenimi modelleri, web'den kazınan verilerdeki şablonları tanıyarak ve çoğaltarak çalışmakta.
Meta ise AudioCraft'ın araştırmacılar için oluşturulduğunu vurguluyor. Müzik ve ses üretimi alanında geliştiricilerin ilgisine sunulan başka yapay zeka araçları ve modeller olduğunu belirtmekte fayda var.
Hatırlarsanız bu yılın başlarında Google da metinleri müziğe dönüştüren MusicLM isimli yapay zeka aracını tanıtmıştı. Şirket, MusicLM'i Mayıs ayında geliştiricilerin ilgisine sundu. Müziği görselleştirerek besteleyen bir yapay zeka olan Riffusion'ın yanı sıra Google'ın kendi AudioML'i ve OpenAI'ın Dance Diffusion'ı da aynı görevi yapabiliyor.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap