Google’ın yapay zeka destekli sistemi seslerin %92’sini ayırt edebiliyor
Arama
Yazılım

Google’ın yapay zeka destekli sistemi seslerin %92’sini ayırt edebiliyor

Teknoloji devi Google‘ın uzun yıllardır yapay zeka (AI) ve derin öğrenme alanlarında yaptığı çalışmalar giderek daha da somut hale gelerek meraklıları ile buluşuyor. Google’ın bu teknolojileri kapsayan, son tüketiciye ulaşan ve hanelere kadar giren en yeni ürünlerinden biri de şüphesiz akıllı asistanlar.

Geçtiğimiz ay şirketin düzenlediği  “Made by Google etkinliğinde akıllı hoparlörü Google Home Hub tanıtılmış, ürüne dokunmadan sadece ses ile cihaza kontrolün mümkün olduğu paylaşılmıştı. Google’ın duyurduğu yeni bir AI sistemi ise teknoloji devinin akıllı hoparlörlerden çok daha fazlasını vaat edeceğini gösteriyor.

Şirket, birden fazla insanın bulunduğu ortamlardan, hangi sesin kime ait olduğunu ölçümleyebilen ve analiz eden bir sistem olan Konuşmacı/Hoparlör Diyarizasyonu süreci ile seslerin %92’sini ayırt edebildiğini açıkladı.  Google AI bölümünde araştırmacı olarak çalışan Chong Wang’ın araştırmasına yönelik yayımladığı blog yayısında, bu yapay zeka sistemi ile “denetimli hoparlör etiketlerinin” daha etkili bir şekilde kullanılabildiği açıklandı.

 

Google’ın yukarıdaki örnekte paylaştığı üzere, sistem  aynı ortamda farklı sesleri birbirinden ayırt ederek, onları farklı biçimde segmente edebiliyor. Bu AI teknolojisi, “Kim ne zaman konuştu” problemini çözerek, tıbbi konuşmaları, video altyazısını ve daha fazlasını anlama gibi birçok önemli senaryoda uygulanabilir.  Öte yandan NASA’nın Apollo 11, Apollo 13, Apollo 1 veGemini 8 gibi görevlerinde yer alan astronotların kule ile binlerce saatlik konuşmalarını da deşifre etmek gibi tarihi olaylara da ışık tutabilir. 

Google, araştırmada önemli bir yol aldığını söylese de, halen perdesi açılmamış birçok heyecan verici yönün olduğunun da altını çiziyor. Öncelikle, modeli hassaslaştıran birim, gelecekte çevrimdışı kod çözmeyi gerçekleştirmeye yönelik içeriksel bilgileri kolayca entegre edebileceğini düşünüyor.  İkinci olarak ise , d-vektörleri kullanmak yerine doğrudan akustik özelliklerin modellemesi isteniyor. Bu şekilde, tüm hoparlör diyarizasyon sisteminin uçtan uca bir şekilde eğitilebileceği belirtiliyor. 

Yorumları GösterYorumlar Gizle (0)

Bir Yorum Yazın