Georgetown Üniversitesi'nde iletişim teknolojileri üzerinde çalışan Kalev Leetaru, büyük veri üzerine yaptığı çalışmalarla tanınıyor ve bu yılın başında Internet Archive'in 600 milyon sayfalık kamuya açık tarihi kitap arşivinden, 14 milyon görseli Flickr'a taşıyacak bir proje üzerinde çalışmaya başladı. Görsellerin ücretsiz bir şekilde aranabilir ve indirilebilir olmasını sağlamak amacıyla yürütülen projede bugün itibariyle, yaklaşık 2 milyon 620 bin görsele Flickr'dan erişilebiliyor.
Internet Archive'in tarihi kitapları tarayan Optical Character Recognition (OCR) programının metinlerin dijitalleştirilmesine izin vermesine karşılık görselleri atlaması sorununu çözen Leetaru'nun kendi geliştirdiği yazılım, OCR'ın görmediği görselleri otomatik olarak jpeg formatına dönüştürüyor ve Flickr'a yüklüyor.
Flickr'ın Internet Archive sayfasından erişilebilen görsellerin her biri, detaylı bir tanım, hangi kitaptan alındığı ve konu etiketleri gibi bilgiler içeriyor.
Flickr'da 14 milyon görseli hedefleyen projeyi incelemek isterseniz burada.