Merhaba arkadaşlar şuan bir arama motoru geliştirmekteyim. Node.js kullanarak gerçek zamanlı bir örümcek oluşturdum. bu konu hakkında hiç problem yok. Yeterli alt yapım olursa 24 saat içinde milyonlarca sayfa eklemem oldukça mümkün..
Ancak sizinde anlayacağınız üzere mysql bu iş için hiç yeterli değil. Hazır başlamışken projenin kendine özel bir veri tabanı olsun istiyorum. Nosql sistemler üzerinde daha önce hiç çalışmadığım için algoritma açısından biraz tıkandım.
Proje için en uygun algoritmayı oluşturmaya çalışıyorum,malesef yıllardır mysql türevi veri tabanlarında çalıştığım için aklıma bir tek dosya tabanlı çalışan sql'i taklit eden bir yapı geldi.
Şimdi burada şöyle bir problemim var yeterli alt yapıyı sağladıktan sonra sadece bir ay içinde yüz milyonları aşması muhtemel veri var. Verileri şuan deneme amacı ile aşağıda ki şekilde basit dökümanlar olarak saklıyorum >
Veriler içinde önem arz eden bir nokta olmadığı için bu tarz basit dökümanlar şeklinde saklamak oldukça mantıklı geldi ayrıca nosql veri tabanları da genellikle .json (.bson)
türevinde döküman bazlı sistemlerden oluşuyor.
Tuttuğum bu verilerin ortalaması 300 baytı dahi geçmiyor.
Şuan için izlediğim yol bu şekilde ancak daha iyi önerilere tamamen açığım. Bu arada amaç kendimi geliştirmek bu yüzden mongoDB,elastic search gibi sistemleri kullan demeyin.. Hazır yapmışken tamamen benden olsun istiyorum sevgiler..