Öncelikle ilgin ve alakan için çok teşekkür ediyorum. Hoca internet üzerinden sadece konu başlığını verdi,ben de orijinal metni yazayım."A Web Site Tree generating simple Web Spider application." Sadece bu konu başlığı var. Kod için Eclipse programını kullanıyoruz. Basit bir şekilde linkler,sekmeler vb şeyleri çekmeye yarayan bir kod istiyor. Benim bildiklerim de bununla sınırlı.
Rica ederim. Evet, arama motorlarının botlarına benzer bir bot yazmanı istiyor anladığım kadarıyla. Şöyle yapabilirsin:
1. Herhangi bir kırık olmayan link'e (link haritasını oluşturmak istediğin link'e) request gönder. Sonra sayfanın cevabını al. Bu cevap sayfanın HTML kodları olacaktır.
2. Boş bir liste oluştur. Regex ile dönen cevaptaki tüm HTML tag'larını bul. İnternette a tag'ları için örnek bir regex cümleciği bulabilirsin. Daha sonra her a tag'ını listeye ekle.
Bu, tek bir sayfada bulunan link'lerin haritasını oluşturman için yeterli olacaktır. Daha sonra,
3. Boş bir dictionary oluştur. Listedeki her linke sırayla request gönder. Cevaplardaki title tag'ını parse edip dictionary'e link ve title olarak linkleri teker teker ekle.
4. Dictionary'i yazdır.
Basit mantığı bu olsa gerek. Java'ya uzağım ama Python'la yapılması zor değil. Mantık hepsinde de aynıdır. Gelişmeleri ve takıldığın konuları yine buraya yazarsan yardımcı olmaya çalışırız.