İnternet ağı üzerinde dağıtık halde çok fazla veri barınıyor ve gün geçtikçe sayısı da artmaya devam ediyor. Günümüzde bu kadar büyük veri yığını varken bu verilere ulaşabilmek, verilerle oynayabilmek oldukça güç. Bazı zamanlar web sayfalarından veri çekmek istiyoruz ve veri boyutu çok fazla olduğunda bu gerçekten çok büyük bir iş gücüne gereksinim duyuyor. Gary Teh adlı yazılımcı bu problemi yaşamış ve side project olarak GetData adında bir uygulama geliştirmiş.
GetData uygulaması, bir chrome eklentisi olarak çalışıyor. Chrome tarayıcınıza yüklediğiniz bu eklenti ile veri çekmek istediğiniz web sayfasına girerek eklentiyi çalıştırıyorsunuz. Ardından uygulamayı nasıl kullanacağınızla ilgili eklenti size rehberlik ediyor. Çekmek istediğiniz yapısal veri yığınını eklentiye tanıtıp ilerliyorsunuz ve makine öğrenmesi kullanan uygulama gösterdiğiniz yapıyı öğreniyor ve sizin için verileri sayfadan ayıklıyor.
Uygulamanın en dikkat çekici özelliklerinden biri ise sayfalama yapılmış web sayfalarında da doğru çalışması. Örneğin aşağıda görebileceğiniz gibi sayfalama yapılmış bir web sayfasında uygulamaya sayfalamanın nasıl çalıştığını öğreterek diğer sayfalardaki devam eden içerikleri de çekebiliyorsunuz.
Web sayfasından çektiğiniz verileri json ve csv formatında indirebiliyor, oluşturduğunuz bu akıllı sorguyu zamanlayarak belirli periyotlarla tekrarlanmasını sağlayabiliyorsunuz. Bu şekilde periyodik olarak takip etmek istediğiniz verileri bu araç sayesinde elde edebiliyorsunuz.
1 ücretsiz ve 3 farklı ücretli paketi bulunan GetData uygulamasını, community paketini seçerek ücretsiz bir şekilde kullanabilir, test edebilirsiniz. Ücretsiz giriş paketi aylık 500 kayıt indirme limitine sahip. Ayrıca daha fazla indirme limiti veya tarama sıklığı, taranan verinin profile özel olması gibi ekstra ayarlar ile oynamak isterseniz de ücretsiz hesabın sizin için yeterli olmayacağını hatırlatalım.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap