Carnegie Mellon Üniversitesi'ndeki yapay zeka araştırmacıları kelimeleri fiziksel hareketlere çeviren bir yapay zeka aracı üretti. Joint Language-to-Pose ismiyle ya da JL2P kısaltmasıyla anılan bu araç, doğal dili 3 boyutlu duruş modelleriyle ilişkilendiriyor.
Pozları tahmin eden eklem yerleştirme, uçtan uca eğitim programı öğrenimi ile eğitildi. Bu eğitim kapsamında yapay zeka, daha zor hedeflere geçmeden önce daha kısa görev tamamlama dizilerini yerine getirdi.
Şimdilik çöp adamlarla sınırlı olan JL2P animasyonları, uzun vadede kelimeleri insan hareketlerine çevirerek insansı robotların fiziksel görevleri yerine getirmesini sağlayabilir. Aynı şekilde bu teknolojinin oyunlar veya filmler için sanal karakterler yaratabilmesi de olası.
Bu arada JL2P'nin kelimeleri görselleri dönüştüren ilk çalışma olmadığını da hatırlatalım. Microsoft'un Haziran ayında tanıttığı ObjGAN, açıklamalardan görsel eskizler ve storyboardlar üretirken, Disney'in ürettiği yapay zeka algoritması storyboard üretmek için senaryodaki metinlerden faydalanıyor. Nvidia'nın GauGAN'ı ise ağaçlar, dağ ve gökyüzü gibi kelimelerle etiketli fırçalar ile kullanıcıların manzara resimleri çizmesini sağlıyor.
JL2P'nin yetenekleri kapsamında yürüme, koşma, gitar veya keman gibi enstrumanlar çalma, sağ ve sol gibi yön talimatlarını takip edebilme, yavaş veya hızlı olmak üzere hız kontrolü sağlayabilme yer alıyor.
Son olarak JL2P'nin 2018'de SRI International araştırmacıları tarafından önerilen son teknoloji AI ile karşılaştırıldığında, insan hareketi modellemesinde yüzde 9 iyileşme kaydettiğini belirtmekte fayda var