Ses hatta video içerikleri de artık yazı kadar kullanımı kolay ve doğal hale geliyor. Y Combinator Kış 2016 girişimleri arasında bugün öne çıkanlarda yer alan DeepGram, Google'ın yazılı metinlere yaptığını ses için yapıyor.
DeepGram'in derin öğrenme tabanlı teknolojisi doğrudan ses kayıtlarını endeksliyor ve işletmeler için bu kayıtları aranabilir hale getiriyor. Çağrı merkezleri gibi ses kayıtlarına sıklıkla başvuran şirketler DeepGram üzerinden bir müşteri ismi ya da görüşme içeriğine dair bir bilgi aratabiliyor. ABD'de her yıl milyarlarca saatlik ses kaydı oluşturulduğu ancak bunun en fazla yüzde 25'inin analiz edilmiş durumda olduğu düşünüldüğünde DeepGram önemli bir sorunu adresliyor.
Uzunca süredir konuşulmasına karşın benzer teknolojilerin bugün geliştirilmesinde başta derin öğrenme alanında sağlanan ilerlemeler ve bir konuşmanın karmaşıklığıyla başa çıkabilecek nöral ağların bugün kullanıma sunulması etken. Aynı zamanda ses kayıtlarının bulutta saklamanın birim maliyetindeki düşüş de önemli bir paya sahip.
Sesle çalışan tipik arama motorlarının çalışma prensibi sesi önce yazıya çevirip ardından aramayı yazı üzerinden yapmaya dayanıyor. DeepGram benzer bir yöntem izlemesine karşın, sesi doğru "anlama" ve bu arama motorlarından çok daha doğru sonuç verme iddiasında.
DeepGram'in arama motoru çağrılardan podcast'lere, video kayıtlarından online derslere kadar geniş bir alanda kullanılabiliyor. İşletmeler API'ını entegre ederek ses kayıtlarını aranabilir hale getirerek raporlar oluşturmaya başlayabiliyor. Asıl soru ise bireysel kullanıcılar için bu özelliğin ne zaman yaygın olarak kullanılmaya başlanacağı.
DeepGram ile ilgili daha fazla bilgi ve eğlenceli içerik için demo sayfalarına gidebilirsiniz.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap