Buray Savas ANIL adlı üyeden alıntı

Google kadar sonuç; sanırım herkesin tek beklentisi bu ancak yeni kurulmuş bir sistemin bunu vermesi ne yazıkki imkansız. 14 yıllık veri depolamış biri ile ve güncel olarak her zaat en az 200 sunucu sistemine ekleyen ir sistem ile yarıştırmayı düşünmek bence biraz tutarsızca olabiilir. Arama Motoru denildiğinde her siteyi anında indexleyebilir ve inceleyebilir gözü ile bakılıyor ancak bu şekilde bir sistem dünyada yok Google'da da yok. Arama Motoru; örümceklleer vasıtası ile Spider dediğimiz araçlar ile sitelleri gezer ve en uygun verileri index altına alır. Çeşitli analizler yaparlar. Tüm ssiteleeri takip edebilmek için dünyadaki tüm siteler kadar IP adresine ihtiyacınız olur. Her bir ip adresi o siteyi incelemek ile mükelleftir. Dolayısıyla bu pek mümkün değil. Google'da bir spider yaklaşık 200,000 siteyi gezebiliyor anlık olarak bu sayede her biriinde aynı algoritma ile hareket eden binlerce ip'ye sahip oluyor bunlarda yeterli olmadığı için yeni Block IP lersatın alıyor IPV4 kullanıyor bunu da bulmak şu anda oldukça zorlaştı. Çok derin bir konu ancak ilk yapacağımız populer siteleri indexlemek olucak. Sonrasında kullanıcıya doyurucu bilgiyi vermeyi hedefliyoruz.

Ek Olarak: Populer siteler derken 1,000,000 populer siteden bahsediyorum. Örneğin Alexa'da bulunan 1,000,000 site.




Bir zamanlar bende uğraşmıştım , http://www.sphider.eu/ bu sistemin botunu incelerseniz nasıl olduğunu anlarsınız dmoz.org gibi sitelerden içerik çeken bir sistem.