Sesi veya videoyu yazıya dönüştürmek için yapay zeka destekli API sunan girişim: AssemblyAI

AssemblyAI, kullanıcılarına sesi veya videoyu metne dönüştürmek için yapay zeka destekli bir API sağlıyor.
Sesi veya videoyu yazıya dönüştürmek için yapay zeka destekli API sunan girişim: AssemblyAI

Son dönemde yapay zekaya olan ilginin ne denli arttığından sıklıkla bahsediyoruz. Yapay zekanın etkisinin her alanda hissedildiği bu günlerde, odağına bu kavramı alan girişimler de bir adım önde ilerliyor. Aldığı yatırımlarla bir süredir adından söz ettiren AssemblyAI da bu girişimlerden biri. 

Kaliforniya merkezli AssemblyAI, kullanıcılarına sesi veya videoyu metne dönüştürmek için yapay zeka destekli tek bir API sağlıyor. Ses verilerini yazıya dökmek, anlamak ve analiz etmek için model içi geliştirmeye yardımcı olarak geliştiricileri güçlendirmek için tasarlanan girişim, otomatik transkripsiyon, konu algılama ve içerik denetimi için 80'den fazla dilde hizmet veriyor. 

Öncelikle, platformu kullanmak gerçekten çok basit. Öncelikle bir üyelik oluşturuyor ve ne iş yaptığınızı, ekibinizin kaç kişiden olduğunu ve meslek tanımınızı belirtiyorsunuz. Akabinde eğer elinizde bir ses dosyası varsa platforma onu yükleyebiliyor veya bir YouTube videosunun linkini ekleyerek videodaki sesi yazıya dönüştürebiliyorsunuz. Ben öncelikle bir Türkçe video denedim, ancak başarısız oldu. Daha sonra yaklaşık 9 dakikalık İngilizce bir videonun linkini eklediğimde, videodaki konuşmanın 1-2 dakika içinde eksiksiz bir şekilde yazıya dönüştürüldüğünü gördüm. 

Özetleme, konu tespiti, küfür filtreleme gibi birçok özellik mevcut

Bu arada uygulamanın tek sunduğu transkripsiyon değil. AssemblyAI, özetlemeden konu tespitine, otomatik bölümlerden içerik denetimine, önemli ifadelerden duygu analizine birçok şeyi sunuyor. Platformu kullanarak dilerseniz küfürleri filtreleyebiliyor, dilerseniz çift kanal ses dosyalarını ayrı ayrı yazıya dökebiliyorsunuz. 

Uygulamayı denemek ücretsiz. AssemblyAI da tıpkı OpenAI gibi bir oyun alanı oluşturmuş. Ancak girişiminiz API'ı kullanacaksa bunun için küçük miktarlarda ödeme talep ediliyor. Geliştiriciler, ses saniyesi başına 0,00025 dolardan başlayan nispeten düşük bir maliyetle API kullanabiliyorlar. Audio Intelligence özelliğinden yararlanmak için bu 0,00025 doların üzerine saniye başına alınan ücret ise 0.000583 dolar. Bu özellik, yukarıda bahsettiğim ek özelliklere erişim sağlanmasına yardımcı oluyor. 

AssemblyAI'ı kendi adıma oldukça başarılı buldum. Zaten şirket bugüne kadar 63.1 milyon dolar yatırım alarak yatırımcıların da dikkatini çekmiş durumda. Üstelik şirketin yatırımcıları arasında Y Combinator, Accel, Insight Partners gibi isimler var.

Girişime buradan göz atabilirsiniz. AssemblyAI'ın adını ileride OpenAI gibi adını sıkça duyacağımıza eminim.

Teknoloji dünyasındaki gelişmeleri takip edin. Neleri size ulaştırmamızı istersiniz?
Abonelik kaydınız başarıyla oluşturuldu.