Teknoloji

Meta AI'ın yeni ses sıkıştırma yöntemi, MP3 formatındaki sesleri 10 kata kadar kalite kaybı olmadan sıkıştırabiliyor

Encodec ile Meta AI araştırmacılarının, kalite kaybı olmadan 64 kbps'de MP3'e kıyasla 10 kat daha küçük sıkıştırma oranı elde ettiği açıklandı.

Gözde Ulukan 02 Kasım 2022

Meta AI'ın yeni ses sıkıştırma yöntemi, MP3 formatındaki sesleri 10 kata kadar kalite kaybı olmadan sıkıştırabiliyor

Meta AI, geçtiğimiz günlerde Twitter üzerinden bir duyuru gerçekleştirdi. Bu duyuruda şirketin Encodec adı verilen yeni ses sıkıştırma yöntemi odak noktasıydı. Bu yöntem ile Meta AI araştırmacılarının, kalite kaybı olmadan 64 kbps'de MP3'e kıyasla 10 kat daha küçük sıkıştırma oranı elde ettiği açıklandı. Söz konusu ürün ile ilgili tüm detaylar bir makalede açıkça paylaşıldı.

Müzik parçaları için kullanılabilen teknik, Meta'nın söylediğine göre, sorunlu hizmet bulunan bölgelerdeki telefon görüşmeleri gibi düşük bant genişliğine sahip bağlantılarda konuşmanın ses kalitesini önemli ölçüde artırabiliyor.

Meta'nın paylaştığı bilgilere göre Encodec, üç farklı bölümden oluşuyor: Kodlayıcı (encoder), niceleyici (quantizer), kod çözücü (decoder). Encoder, sıkıştırılmamış verileri daha düşük kare hızlı gizli uzay temsiline dönüştürüyor. Quantizer, daha sonra orijinal sinyali yeniden oluşturmak için kullanılacak en önemli bilgileri takip ederken temsili hedef boyuta sıkıştırıyor. Decoder ise tek bir CPU üzerinde bir sinir ağı kullanarak sıkıştırılmış verileri gerçek zamanlı olarak sese dönüştürüyor.

Encodec, our AI-powered compression neural net, has 3 parts:
1️⃣ Encoder: transforms raw data into higher dimensional + lower frame rate
2️⃣ Quantizer: compresses to target size, equiv. to mp3
3️⃣ Decoder: turns compressed signal back to waveform, most similar to the original

3/5 pic.twitter.com/S4AvsNgztP

— AI at Meta (@AIatMeta) October 25, 2022

?s=20&t=rZcLIiZg-1nfbpgb-5TwFA

Meta, Encodec'i kullanarak, düşük bit hızlı konuşma sesi sıkıştırmasında son teknoloji ürünü sonuçlar elde ettiğini söylüyor. Ekip, nicemleme tekniklerinin sınırlarına henüz ulaşamadıkları için daha da küçük dosya boyutlarına ulaşabileceklerine inanıyor. Yani kısa bir süre sonra 10 katın çok daha fazlasına ulaşma ihtimali var. Bu noktada Encodec'in metaverse ile ilişkilendirildiğini de belirtmek gerek. Zira Meta AI araştırmacıları, teknolojinin sonunda büyük bant genişliği iyileştirmeleri gerektirmeden zengin metaverse deneyimleri sunabileceğini de belirtiyor.

Bu konuda bizi nasıl bir geleceğin beklediğini hep birlikte göreceğiz.

Meta AI'ın yeni ses sıkıştırma yöntemi, MP3 formatındaki sesleri 10 kata kadar kalite kaybı olmadan sıkıştırabiliyor

Yorumlar

İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap

Meta AI'ın yeni ses sıkıştırma yöntemi, MP3 formatındaki sesleri 10 kata kadar kalite kaybı olmadan sıkıştırabiliyor

Sıradaki haber