Bilgisayarların konuşmayı öğrenmesine çok az kaldı. Apple'ın kişisel asistanı Siri bu anlamda önemli bir adım. Fakat ses ve konuşma tanımlayıcı yazılımlar insanların makinelerle sesli iletişimine dair sorunların sadece ufak bir kısmına çözüm getirebiliyor. Çünkü James Borg'un çalışmasına göre insanlar arasındaki iletişimin sadece %7'si sözcüklerden oluşuyor. Kaliteli bir iletişimi oluşturan ise tüm iletişimin %38'i oluşturan sesin tonu, şiddeti, konuşma hızı gibi diğer etmenler(%55'i ise vücut dili).
Makinelerin insanların kullandıkları kelimeleri anlayabilmeleri ilk adım olsa da bütünsel bir iletişim için yeterli değil. Neyse ki Madrid ve Granada Üniversitelerinde görevli bilim adamları insanların sadece sözcüklerini değil, konuşma şekillerinden o andaki hislerini ve ruhsal durumunu anlayabilen bir sistem geliştirdiler.
İnsan sesi ile ilgili 60'ın üzerinde parametreyi hesaba katarak bir kişinin konuşma anındaki ruh durumunu tanımlayabilen bu sistem şu an için çok yeni ama sunduğu potansiyeller tahminlerimizden çok daha kısa süre içerisinde bu ve benzeri sistemler ile gündelik hayatımızda karşılaşmaya başlayabileceğimizi gösteriyor.
Bu tarz sistemlerin kullanım alanı olarak ilk akla gelen acil durum çağrılarının daha sağlıklı yönetilebilmesi. Telefon hattının diğer tarafındaki kişinin ruh hali, acil durumlarda büyük önem taşıyor ve bu durumlarda iletişimin doğru bir şekilde yönetilebilmesi son derece kritik.
Fakat bunun dışında özellikle müşteri hizmetleri alanında bu sistemin çok geniş bir kullanım potansiyeli olabilir. Pazarlama alanında kitleler yerine bireylerin giderek daha fazla önem kazandığı günümüzde her bir müşteri ile doğru iletişim kurabilmek ürün, hizmet veya marka ile müşteri arasında çok daha sağlıklı bir iletişim ve dolayısıyla daha sıkı bir bağ kurulmasını sağlayabilir.
Sistem şu anda kullanıcıların ses özelliklerinden ruh hallerini anlayabiliyor ve çalışmanın daha ilerleyen aşamalarında kullanıcıların bir sonraki söz ve aksiyonlarını tahmin edebilir hale gelecek.