Yandex'in Türkiye pazarına girmesi kullanıcı tarafında Google'ın itibarını henüz etkilememiş görünüyor ama Yandex 1 yıldır devam eden çalışmalarından çıkan bir dizi istatistiği paylaşarak kendini daha iyi ifade etmek istiyor.
Yandex'in Türkçe web sitelerini detaylı bir şekilde okuduğunu gösteren verilerin arama sonuçlarına nasıl yansıyacağı elbette önemli. Sanırım Google bu istatistikleri kendilerininkiyle karşılaştırarak Rus arama motoruna karşı daha net bir strateji belirleyecektir. (Belki Google'da bu konuda bir istatistik yayınlar?)
Web Siteleri
Yandex ilk işi olarak siteleri tanımak ve veri tabanına kaydetmekle görevli. Bu konuda bazı istatistikler paylaşıyor;
- Yandex'in istatistiklerine göre Türkçe dilinde 2 milyondan fazla web sitesi var. (.TR ve diğer alan adlarında yer alan Türkçe siteler ve alt alan adlarının toplamı)
- Türkçe sitelerin yalnızca yüzde 10’u ulusal TR alanı ve alt alanlarında yer alıyor. Bu da yukarıda verilen rakama göre 200.000 sitenin TR bağlantılı bir alan adına sahip olduğunu gösteriyor.
- Yandex Türkçe sitelerin içerik potansiyelini de çıkarmış. Buna göre Türkçe sitelerin yüzde 24’ünde tek bir sayfa, yüzde 57’sinde 2 ila 1000 sayfa ve yüzde 19’unda 1000’den fazla sayfa bulunuyor. Worldwidewebsize.com'a göre dünyada bugün itibariyle yaklaşık 11,5 milyar web sayfası bulunuyor.
- İçerik açısından değerlendirildiğinde ise (görseller, ses dosyaları ve videolar hariç) Türkçe web sitelerinin yüzde 81’inin boyutu 1 megabayttan az. Yüzde 12’si 1–10 megabayt arasında, yüzde 7’si ise 10 megabayttan fazla depolama alanı kullanıyor.
Metinler
Yandex web sitelerini analiz ettikten sonra elbetteki bir metin analizi yapmak zorunda. Yandex'in arama sonuçlarına ne kadar isabetli sonuçlar vereceği bu analizlerin başarısına bağlı. Bu analizden bazı bilgiler şu şekilde;
- Türkçe web sitelerinde 900 milyondan daha fazla sözcük var. Bu veriler kâğıda basılırsa 9 metre yüksekliğinde bir yığın oluşturuyor.
- Türkçe sitelerinde yer alan içeriğin yüzde 73’ü 10 bin kelimeden kısa (kalın bir aylık dergi kadar). Yüzde 4’ü ise 1 milyondan fazla sözcük içeriyor. Bu gruptaki sitelerin ortalama sözcük sayısı 21 milyon. Bu 200 ciltlik bir kitap arşivi anlamına geliyor.
- Yandex, Türkçe siteler dikkate alındığında Türkiye’deki her bir internet kullanıcısına (35 milyon, IWS) 25 bin kelime düştüğünü de hesaplamış. Bu ortalama yaklaşık 100 sayfalık bir kitaba karşılık geliyor.
Görseller
Metin tarafında olduğu kadar görsel (resim, fotoğraf) tarafında da Google ile rekabet edebilecek Yandex yine güzel istatistikler paylaşıyor;
- Eğer Türkçe bir web siteniz varsa ve görsel öğe kullanmıyorsanız, yüzde 6'lık bir dilimdesiniz. Yani sadece metinden oluşan 120.000 web sitesinden biri sizinki.
- Türkçe web sitelerinde 188 milyon farklı görsel öğe bulunuyor. Benzer ve kopya görseller hesaba katılırsa bu sayı 268 milyona çıkıyor.
- Yandex, tutucu tahminler dikkate alınsa bile Türkçe web sitelerindeki görsellerin 72 dpi çözünürlükte basılması durumunda 1,9 kilometrekarelik bir alanı kaplayağını hesap etmiş. Bütün görseller üst üste konulduğunda ise 16 metrelik bir yığın oluşturabiliyor.
- Dipğer yandan Türkçe web sitelerindeki görsel zenginlik çok iç açıcı değil. Görsellerin yüzde 43’ü 150x150 piksel sınırındaki küçük resimler. Yüzde 54’ü 150x150–800x600 arasında (orta boy) ve sadece yüzde 3’ü de büyük görsellerden oluşuyor.
- Yandex, Türkçe web sitelerinde en sık rastlanan renklerin gri, beyaz ve turuncu (sonra siyah ve kırmızı geliyor) olduğunu, bu renkler toplamda Türkçe sitelerdeki görsellerin yüzey alanının yüzde 60’ını oluşturduğunu söylüyor.