Google sizin olsaydı, bu algoritma hakkında herkese bilgi vermek ister miydiniz? Ben istemezdim ve Google geçmişte bunu yapmadığı halde, algoritmaları çözülmeye başlamıştı. Bunun üzerine algoritma sayısını arttırdı. Ancak şu gerçeği de görmemiz gerekir ki; Google'ın veri tabanı ne kadar büyük olursa, olsun; web sitelerindeki içeriğin tamamını kontrol edemez. Kontrol edebilmesi için tüm bu verileri, bir veri tabanında toplaması gerekirdi ki, bu imkansız.
Soruya benzer bir soru ile örnek verilebilir. Facebook kullanıcıları, fotoğraflarına kimlerin baktığını öğrenmek istiyorlar. Ancak, her ne kadar Facebook tüm giriş ve çıkışların kaydını tutuyor olsa da; kullanıcıların gezdiği tüm sayfaları veya baktığı resimleri bilmesi olanaksız. (Eğer çok isterse, belki en fazla bir kaç dakika için bakabilir, sonrasında veri tabanında yeterli alan kalmayacağı için bakamaz.) Facebook, (veya Google) bizim hangi sayfaları gezdiğimizi görmek için yalnızca, bizim kendi tarayıcılarımıza gönderilen çerezlerden yararlanır. Eğer her girdiğimiz web sitesinden sonra, tarayıcımızın çerezlerini temizleyecek olursak; kolay, kolay hiçbir şirket alakalı reklam gösteremez. İşte bu küçük mantık, Google'da geçerlidir. Google, sitemizin sayfalarının yalnızca çerezlerini ve meta etiketlerini tutar. Eğer sitedeki içeriği derecelendirir. Bu derecelendirme sırasının büyüklüğüne göre; (yani eğer meta etiketler veya giriş kopya ise) sayfa içeriğini başka (önce çerez ve meta etiketler) önbellek sayfaları ile karşılaştırır. Bunda da yine, veri tabanına yük getirmeyecek yöntemleri tercih eder. Son tercihi ise kendi veri tabanı olur.
Metin aramada ise, sayfaların önbelleklerinden yararlanır. Bu yüzden alexa veya webarchive gibi sitelere önem verir. (Metin arama ve karşılaştırma biraz daha kapsamlı aslında ancak epey karışıktır.)