Microsoft, deepfake üreticisi yayınladı

Microsoft, Azure AI Speech'in bir insanın gerçekçi avatarını oluşturmanızı sağlayan yeni bir özelliğini tanıttı.

Tuğçe İçözü 16 Kasım 2023

Microsoft'un Ignite 2023 etkinliğinde Azure AI Speech'in bir insanın gerçekçi avatarını oluşturmanızı sağlayan yeni bir özelliği tanıtıldı. Araç sayesinde avatarın doğal bir şekilde konuşmasını da sağlıyorsunuz.

Dünden itibaren genel ön izlemede kullanıma sunulan özellik kapsamında, kullanıcılar bir kişinin görüntülerini yükleyerek ve bir senaryo yazarak avatarın konuştuğu videolar oluşturabiliyorsunuz.

Bu noktada Microsoft'un Azure AI Speech animasyonu yönlendirmek için bir modeli eğitirken, ayrı bir metinden konuşmaya modeli de senaryoyu yüksek sesle okuyor. Bu noktada metinden konuşmaya üretken yapay zeka modeli önceden oluşturulmuş ya da kişinin sesi üzerinde eğitilmiş olabilir.

Azure AI Speech ile avatar üretimi

Microsoft'un paylaştığı blog yazısında Azure AI Speech'in yeni özelliği sayesinde sadece metin girişi ile eğitim videoları, ürün tanıtımları ya da müşteri referansları içeren videolar üretilebileceğini ifade ediyor. Ayrıca üretilen avatarı sanal asistanlar ya da sohbet botları oluşturmakta da kullanabilirsiniz.

Avatarlar birden fazla dilde konuşabiliyor. Eğer avatarı bir sohbet robotu olarak kullanmayı düşünüyorsanız, yazdığınız senaryonun dışında kalan soruları yanıtlayabilmesi için OpenAI'ın GPT 3.5 modelinden yararlanabiliyorsunuz.

Azure kullanıcılarının büyük çoğunluğu önceden üretilmiş avatarları kullanabilecek. İlk etapta özelleştirilmiş avatarlara sadece belli kullanım senaryoları için kayıt olunarak sınırlı erişim sağlanabiliyor.

Öte yandan Azure AI Speech kullanan şirketler, oyuncuların görüntülerini kullanarak bir Avatar oluşturabilir. Bu noktada kişilerin dijital ikizleri üzerinden gelir elde etmesini sağlayan The Likeness ürününü incelerken, ABD'de benzerlik ve dijital ikiz kullanımına dair hukuksal süreçleri sizlere aktarmıştık. Buna rağmen, oyuncuların benzerliğini izin almadan veya herhangi bir telif ödemesi yapmadan kullanan stüdyolar ve şirketler mevcut. Her ne kadar SAG-AFTRA grevinde stüdyolar ödeme yapmayı kabul etse de şirketlerin tavrı belirsizliğini koruyor. Microsoft da bu konudaki sorular karşısında sessizliğini sürdürüyor.

Kişisel ses özelliği

Microsoft'un tanıttığı bir başka yenilik ise kişisel ses (Personal Voice) özelliği olduğu. Microsoft’un özelleştirilmiş nöral ses hizmeti kapsamında yayına alınan bu yeni özellik, ses komutu olarak verilen bir dakikalık bir konuşmayı alarak kullanıcının sesini kopyalayabiliyor.

Microsoft'un paylaştıklarına göre, özellik, kişiselleştirilmiş sesli asistanlar üretmek, içerikleri farklı dillerde seslendirmek, hikayeler, sesli kitaplar ve podcast'ler için talebe dayalı anlatımlar oluşturmak için kullanılabilir.

Kişisel ses özelliği ile sesinizi sentezleyebilmek için "açık onay" vermeniz şart. Onay metnindeki ifadeleri okuyarak kaydetmeniz gerekmekte. bir kayıt formu doldurarak bu özelliğe erişim talebinde bulunabiliyorsunuz. Kabul edilmesi gereken şartlar arasında sesin kullanıcı tarafından oluşturulması ve açık uçlu içeriklerin okunmaması da yer alıyor. Ses modeli kullanımının bir uygulama içinde kalması gerektiği belirtiliyor. Bununla beraber söz konusu çıktının uygulamadan yayınlanabilir veya paylaşılabilir olmaması gerektiği ifade edilmekte.