Yahoo, Flickr’ın dev veri setini araştırmacılara açtı

Yahoo Labs

Facebook ve Yahoo’nun ortak özelliklerinden biri, her ikisinin de elinde devasa bir fotoğraf ve video arşivi olması. Facebook’un arşivi, yapay zeka araştırma ekibi tarafından kullanılarak, yüz eşleme teknolojilerinde sağladığı önemli ilerlemeyle ses getirmişti.

Şimdi de Yahoo, araştırma birimi Yahoo Labs’in, Flickr veri tabanındaki 99,3 milyon adet fotoğraf, 700 bin video ve bunlara ait metaveriyi (başlık, kamera türü, tanımı ve etiketleri) araştırmacılara açtığını duyurdu. 12 GB büyüklüğündeki Yahoo Flickr Creative Commons 100 Million adı verilen veri setindeki 49 milyon adet fotoğrafın coğrafi etiket taşıdığı belirtiliyor. Buna ek olarak fotoğraflarla ilgili beğeni, yorum, favoriler, sosyal ağ bilgileri de Flickr API‘ından sorgulanabiliyor. Aşağıda gördüğünüz harita, coğrafi etiketli 1 milyon adet görselin dünyadaki dağılımını gösteriyor.

14446556792_c9f18d9864_b

Elbette, 100 milyon görselden oluşan bu büyük veriyle çalışmak büyük işlemci gücü gerektiriyor. Yahoo, bu veri tabanından araştırmacılar için kullanışlı olabilecek görüntü ve ses özelliklerini erişilebilir hale getirmek için University of Berkeley’in International Computer Science Institute ile işbirliği yapıyor. Araştırmacılar bunun için Enstitü’de bulunan Cray Catalist adında, türünün ilk örneği olduğu iddia edilen veri yoğun işlem yapabilecek bir süper bilgisayarla çalışacak. Bu çalışmayla 12 GB’lık veri setinden yaklaşık 50 TB’lık büyüklüğünde yeni bir veri seti oluşturulacağı tahmin ediliyor. Bu veri setinin yaz sonunda Amazon Web Services üzerinden araştırmacılara açılması planlanıyor.

Bu verilerle ne yapılabileceğini denemek için Yahoo araştırmacılara yönelik bir tür yarışma da açmış. MediEval Placing Task adındaki bu yarışma, görsellerin, koordinat gibi konum bilgisi olmadan nerede oluşturulduğunu tahmin etme hedefi taşıyor. Araştırma kaynak olarak Yahoo Flickr Creative Commons 100 Million veri setinin coğrafi etiketli görsellerini kullanıyor.

Yahoo Flickr dataset

Yukarıdaki görsel, bu devasa verisetinden minik bir parçaya ait, neye benzediğini merak edenler için. Yahoo’nun Flickr’a iat bu dev veri tabanını açması özellikle görsel algoritmalar üzerinde çalışan araştırmacılar için oldukça değerli bir kaynak. Zira araştırmacılar için belki en önemli sıkıntılardan biri bu tip büyük bir görsel havuzuna sahip olmamak. Bununla birlikte Yahoo’nun da atıl şekilde bekleyen milyonlarca fotoğraftan muazzam bir değer yaratması anlamına geliyor bu adım.

İncelemek isterseniz veriseti burada. Araştırmanızda kullanmak isterseniz, erişim talebi için buraya gitmeniz gerekiyor.

Bir Cevap Yazın