Headroom, video konferans ekosistemine yapay zeka getiriyor

Yapay zeka tabanlı video konferans aracı Headroom, bilgisayarla görme ve doğal dil işlemeden faydalanıyor. Headroom video konferansın yazılı metne dökülmesi, önemli konuların öne çıkarıldığı toplantı özetleri, jest tanıma ve video kalitesini arttırma özelliklerine sahip.
Headroom, video konferans ekosistemine yapay zeka getiriyor

Pandemiyle birlikte video konferans uygulamalarının kullanımı oranlarının ciddi seviyede artış gösterdiğini hepimiz biliyoruz. Zoom'un ücretsiz kullanıcı kayıt sayısı Nisan 2020’de Ocak ayına göre 139 kat artış gösterirken, Google G-Suite, araçlarının merkezine Meet'i yerleştirerek Google Workspace adını aldı. 

Ayrıca yaşanan kullanım artuışıyla birlikte pazarda farklı çözümler sunan yeni oyuncular da belirmeye başladı. Sizlerle daha önce de paylaştığımız gibi video konferans uygulamalarında öne çıkan oyuncuların ayrışma noktaları gittikçe daha önemli hale geliyor.

Headroom ise bu ayrışma noktalarını öne çıkaran girişimlerden biri olarak karşımıza çıkıyor. Video Konferans araçlarına yapay zeka teknolojisi getiren Headroom, bilgisayarla görme ve doğal dil işlemeden faydalanıyor. 

Headroom'un amacı bu teknolojier ile yeni özellikler üreterek video konferans deneyimini yeni çok daha ileriye taşımak. Headroom'un getirmeyi planladığı özellikler arasında video konferansın yazılı metne dökülmesi, önemli başlıkların öne çıkarıldığı toplantı özetleri, jest tanıma ve video kalitesini arttırmak yer alıyor. 

Şimdilik ürününü kullanıcılara açmayan girişim, bekleme listesiyle demo sürecine dahil edebiliyor. 

Headroom'un gelecek planları 

Şirket ürünlerini kademeli olarak çıkarmayı planlıyor. İlk etapta video konferansta gerçekleşen konuşmanın tüm metnini almanızı sağlayan özellik yayınlanacak. Bu özellik, aynı zamanda metinde bir hata varsa, videoyu yeniden oynatarak metnin düzenlenmesini sağlayacak. 

Yayınlanması beklenen ilk özellikler arasında toplantıdaki önemli konuları içeren bir özet sunulması da yer alıyor. Toplantı esnasında konuşmanın değişmesini sağlayan Jest tanıma özelliği de ilk etapta yayına alınacaklardan biri. 

Jest tanımanın, konuşan diğer kişileri bölmekte zorluk çeken kişiler için ideal bir özellik olduğunu söyleyebiliriz. Jest tanıma dinleyicilerin nabzını tutmak isteyen konuşmacılar için de birebir. Bu özellik sayesinde konuima esnasında dinleyicilerin ne zaman ilgisinin dağıldığı tespit edilebiliyor.

Hatırlarsanız, bu konuda benzer bir yaklaşımı Microsoft Teams ürününde de görmüştük. Teams, bu konuda bir araştırma yürüterek dinleyicilerin dikkatini çekmenin tasarımsal yollarını hayata geçirmeye başlamıştı. 

Headroom'un çözdüğü en önemli problemlerden biri ise video konferansların düşük görüntü  kalitesi. Video konferanstaki piksellerin kalitesini optimize etmeyi planlayan Headroom, arkaplandaki görüntünün aktarımını azaltarak konuşan kişinin piksel aktarımına devam edecek. Böylece konuşmaya zayıf bağlantı ile katılan kişilerin görüntülerini iyileştirecek.  

Headroom'un kurucuları kim? 

Headroom'un kurucuları Julian Green ve Andrew Rabinovich alanlarında oldukça deneyimli isimler. Green, Google'da Cloud Vision API dahil olmak üzere bilgisayarla görme ürünlerinin geliştirilmesine katkıda bulundu. Yapay zeka girişimi JetPac'in Google tarafından alınmasıyla Google ekibine dahil olan Green, daha önce de Houzz'un kurucu ortakları arasında yer alıyordu. 

Girişimin diğer kurucu ortağı  Andrew Rabinovich ise Magic Leap'te 5 yıl deneyime sahip. Son  yıllarda Magic Leap'te Yapay Zeka başkanı  görevini üstelenen Rabinovich, önceki yıllarda derin öğrenme direktörü ve mühendislik başkanı görevlerini yerine getirmişti. Rabinovich'un Magic Leap deneyiminden önce Google'da bilgisayarla görme ve makine öğrenmesi alanında uzmanlaşan yazılım mühendisi olarak yer aldı. 

Yatırım

Headroom, tüm bu önemli özelliklerin ve teknolojik arka planın yanı sıra bugün 5 milyon dolar tohum yatırımı aldığını duyurdu. Girişimin kurucuları kadar yatırımcıları da alanında yetkin isimler. 

Yatırım turuna Google’ın yapay zeka yatırım sermayesi Gradient Ventures 'dan Anna Patterson, görsel teknolojiler geliştiren girişimleri destekleyen LDV Capital'den Evan Nisselson, şu anda AME Cloud Ventures'ta faaliyet gösteren Yahoo kurucusu Jerry Yang, Morado Ventures'tan Ash Patel, ,Kaggle.com'un kurucu ortağı ve CEO'su Anthony Goldbloom  ve Cornell Tech dekan yardımcısı ve bilgisayarla görme ve makine öğrenmesi profesörü Serge Belongie katıldı.