Adobe, geçtiğimiz gün düzenlediği geleneksel MAX konferansında, Photoshop’un resim ve fotoğraflara yaptığını ses dosyalarına uygulamayı sağlayan ses düzenleme yazılımı Project VoCo’yu tanıttı. VoCo, yaklaşık 20 dakikalık konuşma içeren bir ses kaydı örneğine ihtiyaç duyuyor ve kendine özgü algoritması sayesinde konuşmacının sesini analiz ediyor. Bu analiz sonucunda konuşmanın üzerinde adeta bir yazıyı düzenler gibi değişiklikler yapıp, konuşmacının hiç söylemediği kelimeleri konuşmaya eklemeye, seçtiğimiz kelimeleri silmeye ya da kırpıp konuşma içerisinde başka bir yere yapıştırmamızı sağlıyor.
Teknolojiyi geliştiren ve konferans sırasında tanıtan Adobe geliştiricisi Zeyu Jin, projenin, bir hayli yaygın kullanımı olan konuşma sentezi (text-to-speech) teknolojisinden yararlanmadığının altını çiziyor. VoCo’nun sesi düzenlerken kullandığı yöntem ise ses dönüştürme (voice conversion) tekniği. Algoritma, kullanıcıların elle müdahalesi gerekmeden otomatik olarak ses dönüşümü yapıp, yeni eklenen ya da çıkarılan kelimelerden sonra konuşmayı hiçbir değişiklik olmamış gibi eski hızında ve bütünlüğünde birleştirebiliyor.
Adobe'un yayınladığı yazılı açıklama ise prototipin geliştirilme sebebini açıklar nitelikte: “Voice over, dialog ya da bir hikaye kaydederken insanlar genellikle sonradan yeni bir kelime eklemek ya da var olan kelimeler üzerinde değişiklik yapmak isterler. Bu, konuşma sırasında yapılan bir hatayı düzeltmek ya da hikayenin seyrini bütünüyle değiştirmek istemekten kaynaklanabilir. Yeni geliştirdiğimiz teknoloji Project VoCo ile değiştirmek ya da eklemek istediğiniz kelimeleri yazarak ses dosyasını düzenleyebilirsiniz. Algoritma, konuşmacının değiştirilen kelimeleri gerçekten söylediğini düşünmemizi sağlıyor."
Henüz geliştirilme aşamasında olan Project VoCo'nun kesin çıkış tarihi belli değil.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap