x

Küresel veri tabanı projesi GDELT’in yeni versiyonu 65 dilde gerçek zamanlı çeviri yapıyor

2015-gdelt-2GDELT (Global Data on Events, Languages and Tone) dünyanın tüm bölgelerinden, 100 dilde yapılan online ve offline yayınları anlık olarak takip ederek, geçmişten günümüze insanlık tarihinin kaydını tutan bir büyük veri projesi. Bu haliyle yeterince iddialı olsa da GDELT aslında bundan daha fazlası, zira proje ile tutulan tüm kayıtlar ve bu kayıtlardan anlamlı analizler çıkaran araçların tamamı ücretsiz olarak ilgililere sunuluyor. 2011 yılında tohumları atılan ve yaklaşık 1,5 yıl önce herkesin erişimine açılan GDELT, dün duyurduğu ileri versiyonu GDELT 2.0 ile oldukça etkileyici yeni özellikler sunmaya başladı.

GDELT 2.0 ile birlikte gelen en önemli yeniliklerden ilki GDELT Translingual‘ın kamu erişimine açılması. “Dünyanın en büyük gerçek zamanlı otomatik haber tercüme uygulaması” şeklinde tanımlanan GDELT Translingual, 65 dilde gerçek zamanlı çeviri yapabiliyor. Bu, dünyanın İngilizce dışındaki dillerinin yüzde 98,4’ünü kapsandığı anlamına geliyor. Dünyanın haber bültenlerini İngilizce kaynaklı haberlerin domine ettiği düşünülürse, GDELT Translingual’ın yaygın kullanımı dünyayı algılayış biçimimizdeki birçok anomaliyi değiştirebilecek türden.

gdeltDünya çapında olayları ve insanları takip ederek iki temel veri seti oluşturan GDELT, eylemler, çatışmalar vs. gibi fiziksel aktiviteleri 300’ün üzerinde kategoride kodlayarak Event Database‘de tutuyor. Bir diğer veri seti olan GDELT Global Knowledge Graph (GKG) ise, bağlam odaklı olarak her bir olaya bağlı kişi, konum bilgilerini temalar ve duyguları da yorumlayarak kaydediyor. Yani olayın nerede geçtiği, kimlerin katıldığı ve dünyanın bu konuda ne hissettiği de kodlanabiliyor. GDELT 2.0 ile birlikte gelen yeniliklerden biri de bugüne kadar haberlerdeki 230 farklı duygu ve temayı tanıyan projenin bu sayıyı 2 bin 300’e çıkarmış olması. GDELT15 dil için yapılabilen analizi geçtiğimiz Ekim ayında tanıttığı GCAM (Global Content Analysis Measures) ile yapıyor.

Eklenen temalarla birlikte GKG, dünyanın farklı bölgelerinde ısınmanın maliyeti gibi ekonomik konulardan majinalleşme gibi sosyolojik konulara kadar 100 farklı temaya dair iç görüler sunabiliyor.

GDELT 2.0 ile gelen yenilikler bunlarla sınırlı değil. Aralarında dünyanın “Batı”sı  dışındaki bölgelerin yüksek çözünürlükte görselleri, bir olayın küresel medyada nasıl yayıldığını izlemeyi sağlayan özellik, videolar, coğrafi bilgiler gibi çok sayıda özellik kullanıcılara sunuluyor. (Yeniliklerin tamamını görmek için linki takip edebilirsiniz.)

Google Cloud tabanlı olarak geliştirilen GDELT’in Global Knowledge Graph’i artık Google BigQuery’den de erişilebiliyor.

GDELT, günümüzde büyük veri alanındaki en yetkin isimlerden biri olarak kabul edilen Kalev H. Leetaru‘nın imzasını taşıyor ve ilk olarak University of İllnois ‘te başlatıldı.

Bugüne kadar karşılaşmadıysanız GDELT kesinlikle keşfedilmeye değer bir proje ve sunduğu kaynaklar başta araştırmacılar ve veri gazetecileri olmak üzere birçok kişinin ilgisini çekebilir. GDELT Project ana sayfasına gidip, keşfe başlamak için linki takip edebilirsiniz.

Bir Cevap Yazın