Yapay Zeka

Meta'dan yapay zeka destekli ses klonlama aracı: Audiobox

Audiobox, Meta'nın bu alandaki önceki çalışması Voicebox'un üzerine inşa edilen ses üretimi için yeni bir temel araştırma modeli olarak tanımlanıyor.

Gözde Ulukan 12 Aralık 2023

Meta'dan yapay zeka destekli ses klonlama aracı: Audiobox

Teknoloji devlerinin yapay zeka yarışında her gün yeni bir araçla tanışıyoruz. Bu kapsamda son olarak Meta'dan ses odaklı bir yapay zeka aracı geldi. Facebook AI Research (FAIR) laboratuarında çalışan araştırmacılar tarafından Meta'nın web sitesinde tanıtılan Audiobox, bu alandaki önceki çalışması Voicebox'un üzerine inşa edilen ses üretimi için yeni bir temel araştırma modeli olarak tanımlanıyor.

Audiobox, ses girdileri ve doğal dil metin istemlerinin bir kombinasyonunu kullanarak sesler ve ses efektleri üretebiliyor. Bu da çok çeşitli kullanım durumları için özel ses oluşturmayı kolaylaştırıyor.

Klonlanmış bir sesin söylemesini istediğiniz bir cümleyi veya oluşturmak istediğiniz bir sesin açıklamasını yazmanız yeterli oluyor, bu adımdan sonra geri kalan işlemi Audiobox tek başına hallediyor. Kullanıcılar ayrıca kendi seslerini kaydedebiliyor ve Audiobox tarafından klonlanmasını sağlayabiliyorlar.

Meta ayrıca, siren sesi ya da oynayan çocuklar gibi daha fazla ortam sesi ve ses efekti üretmek için bir model ailesi oluşturduğunu ve bunların hepsinin kendi kendini denetleyen model Audiobox SSL üzerine inşa edildiğini belirtiyor. SSL, verilerin halihazırda etiketlenmiş olabileceği denetimli öğrenmenin aksine, yapay zeka algoritmalarının etiketlenmemiş veriler için kendi etiketlerini oluşturmak üzere atandığı bir derin öğrenme tekniği olarak tanımlanıyor.

Meta, Audiobox'un interaktif demolarında bunun bir araştırma demosu olduğunu ve herhangi bir ticari amaç için kullanılamayacağını açıkladı. Şunu da belirtmeden geçmeyelim; geçtiğimiz hafta tanıtılan yeni Imagine by Meta AI görüntü oluşturma web uygulaması gibi, Audiobox da açık kaynak kodlu değil.