Konu yapay zeka sesler olduğunda akla ilk gelen girişim olan ElevenLabs, ses dosyalarından istenmeyen sesleri çıkarmanızı sağlayan yeni AI Voice Isolator aracını duyurdu. Araç, ElevenLabs platformunda bugünden itibaren kullanıma sunuldu.
AI Voice Isolator'ın öne çıkan özellikleri
AI Voice Isolator, içerik üreticilerin, film, podcast, veya YouTube videosu gibi içeriklerden istenmeyen ortam gürültüsünü ve sesleri çıkarmasına imkan tanıyor. İlgili dosya yüklendikten sonra, Eleven Labs'in yapay zeka modelleri dosyayı işlemenin ardından istenmeyen gürültüyü tespit edip kaldırıyor. Bu sayede araç, çıktı olarak net diyaloglar sunmuş oluyor.
ElevenLabs'in aktardıklarına göre ürün, stüdyoda kaydedilen bir içeriğe benzer kalitede bir konuşma ortaya çıkarıyor. Şirketin tasarım müdürü Ammaar Reshi'nin paylaştığı demoda aracın bir yaprak üfleyicinin gürültüsünü ortadan kaldırdığını ve videodaki konuşmacının sesini öne çıkardığını görüyoruz. Araç özelinde, net bir tarih verilmemekle birlikte önümüzdeki haftalarda API erişiminin de açılması planlıyor.
Şirketin büyüme departmanında görev yapan Sam Sklar ise aracın, bu aşamada müzik vokalleri üzerinde çalışmadığını dile getiriyor. Sklar'ın ifadesine göre; yine de kullanıcılar müzik odağında aracı deneyebilir ve araç bazı şarkılarda başarılı olabilir.
ElevenLabs, model oluşturmak için yararlandığı teknoloji, yöntem ve veri setlerini paylaşmayı tercih etmiyor. Bu anlamda akıllara, yüklenen seslerin eğitim için kullanılması ihtimali de gelmekte. Ancak Sklar'ın belirttiğine göre; kullanıcılar bir form doldurarak eğitim için kişisel verilerin kullanılmasını devre dışı bırakabiliyor.
ElevenLabs'in bu yeni aracını şirketin web sitesi veya uygulaması üzerinden ücretsiz olarak deneyebilirsiniz. Voice Isolator, sesin dakikası başına 1000 karakter kullanıyor. Şirketin sitesinde kullanıcılar ayda 10 bin karakter hakkı tanımlayan ücretsiz bir plan bulunmakta. Bu da ücretsiz kullanım için ayda 10 dakikalık sese denk geliyor. Ancak daha büyük ses dosyalarındaki arka plan gürültüsünü gidermek isteyen kullanıcılar, aylık 5 dolardan başlayan ücretli planlara geçiş yapabilir.
Bu arada başta Adobe olmak üzere bu alana odaklanan pek çok platformun, içerikteki konuşma kalitesini artırmak için araçlar sunduğunu belirtelim. ElevenLabs'in AI Voice Isolator aracının diğerleriyle yarışacak nitelikte olup olmadığını ise bize zaman gösterecek.
Judy Garland, ElevenLabs'in yapay zeka ile klonladığı ikonik sesler arasında yerini aldı
ElelvenLabs, AI Voice Isolator'ın yanı sıra yeni Reader uygulamasına eklediği ikonik seslerle de gündeme geldi. Geçtiğimiz günlerde dosyaları sesli anlatıma dönüştüren yeni uygulaması "ElevenLabs Reader: AI Audio"yu duyuran ElevenLabs, şimdi de uygulamaya Oz Büyücüsü'ndeki Dorothy rolüyle tanınan Judy Garland dahil olmak üzere ikonik sesler ekledi.
Judy Garland'ın kızı Liza Minnelli, yapılan finansal anlaşmalar karşılığında ElevenLabs'in efsanevi sanatçının sesini klonlamasına izin verdi. Böylece Judy Garland, ikonik ses koleksiyonunda yer alan merhum yıldızlar James Dean, Burt Reynolds ve Sir Laurence Olivier'a eşlik etmeye başladı. Judy Garland'ın eserlerinin temsilcisi Liza Minelli; annesinin sesinin onu seven milyonlarca insanın kullanımına sunulduğunu görmenin heyecan verici olduğunu ifade etti:
"ElevenLabs tarafından sunulan muhteşem yeni teknoloji sayesinde, ailemiz bunun annemize yeni hayranlar kazandıracağına ve annemizin dünyaya bıraktığı ve bırakmaya devam ettiği eşsiz mirasa zaten değer verenler için heyecan verici olacağına inanıyor."
ElevenLabs'in YouTube videosunda Judy Garland'ın Oz Büyücüsü kitabını okuduğunu görebiliyoruz. Yapay zeka sayesinde ünlü yıldızların finansal anlamda da ölümsüzlüğe kavuştuğunu söylemek mümkün. App Store'da yer alan bilgilere göre ElevenLabs Reader: AI Audio, 11 Temmuz 2024 tarihinde Türkiye'deki kullanıcılar ile buluşacak.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap