lostyazilim
tr.link

Httrack Tarzı Kopyalama Programlarını Nasıl Engellerim?

6 Mesajlar 4.454 Okunma
lstbozum
tr.link

Enrico Enrico Üyeliği Durdurulmuş Banlı Kullanıcı
  • Üyelik 11.10.2015
  • Yaş/Cinsiyet 27 / E
  • Meslek Hosting Sağlayıcı
  • Konum İstanbul Avrupa
  • Ad Soyad İ** B**
  • Mesajlar 27
  • Beğeniler 3 / 4
  • Ticaret 9, (%89)
Arkadaşlar merhabalar html kopyalama programlarını nasıl engelleyebilirim tamamını bilginiz var mı acaba?
 

 

wmaraci
reklam

fruzgar fruzgar ProPvPServerlar Kimlik Onayı
  • Üyelik 06.02.2015
  • Yaş/Cinsiyet 28 / E
  • Meslek SD
  • Konum Ordu
  • Ad Soyad F** R**
  • Mesajlar 792
  • Beğeniler 258 / 257
  • Ticaret 11, (%100)
Robots.txt aracılığı ile engelleyebilirsin.

Örneğin:

User-agent: HTTrack
Disallow: /

User-agent: WebZip
Disallow: /

User-agent: CopyRightCheck
Disallow: /

User-agent: SiteSnagger
Disallow: /

User-agent: ProWebWalker
Disallow: /

Aklıma gelenler bunlar. Dahası varsa aynı metodla engelleyebilirsin
Enrico

kişi bu mesajı beğendi.

mts mts WM Aracı Kullanıcı
  • Üyelik 18.10.2013
  • Yaş/Cinsiyet 37 / E
  • Meslek Uykucu
  • Konum Diğer
  • Ad Soyad S** U**
  • Mesajlar 473
  • Beğeniler 54 / 125
  • Ticaret 22, (%100)
Bu yazdığınız yalnızca siteye giren arama motoru botlarını engelliyor diye düşünüyorum, zira robots.txt yalnızca bunlar için. Fakat httrack tarzı yazılımlar web sitesi içeriğini kopyalıyor yani gidip robots.txt dosyasına bakmadan, içeriği alıyor. (Bu benim bildiğim, yanlış biliyor olamazmıyım, olabilirim tabi ki de) Fakat, eğer apache kullanıyorsanız .htacces içerisinden, nginx kullanıyorsanız .conf içerisinden, Header'ında arkadaşın User-agent'larda örnek verdiği isimleri engellerseniz, taramaya, siteyi kopyalamaya başladıklarında boş sayfa ile karşılaşırlar.

Not: Yukarıdada belirttiğim gibi yazılımların içerisinde robots.txt sorgusu olup olmadığını bilmiyorum, olmayacağı kanaatindeyim, o yüzden daha kesin olan bir yöntemden bahsettim, fruzgar'ın bahsettiği şekildede olabilmesi mümkün. Saygılar, sevgiler.
 

 

Enrico Enrico Üyeliği Durdurulmuş Banlı Kullanıcı
  • Üyelik 11.10.2015
  • Yaş/Cinsiyet 27 / E
  • Meslek Hosting Sağlayıcı
  • Konum İstanbul Avrupa
  • Ad Soyad İ** B**
  • Mesajlar 27
  • Beğeniler 3 / 4
  • Ticaret 9, (%89)

mts adlı üyeden alıntı

Bu yazdığınız yalnızca siteye giren arama motoru botlarını engelliyor diye düşünüyorum, zira robots.txt yalnızca bunlar için. Fakat httrack tarzı yazılımlar web sitesi içeriğini kopyalıyor yani gidip robots.txt dosyasına bakmadan, içeriği alıyor. (Bu benim bildiğim, yanlış biliyor olamazmıyım, olabilirim tabi ki de) Fakat, eğer apache kullanıyorsanız .htacces içerisinden, nginx kullanıyorsanız .conf içerisinden, Header'ında arkadaşın User-agent'larda örnek verdiği isimleri engellerseniz, taramaya, siteyi kopyalamaya başladıklarında boş sayfa ile karşılaşırlar.

Not: Yukarıdada belirttiğim gibi yazılımların içerisinde robots.txt sorgusu olup olmadığını bilmiyorum, olmayacağı kanaatindeyim, o yüzden daha kesin olan bir yöntemden bahsettim, fruzgar'ın bahsettiği şekildede olabilmesi mümkün. Saygılar, sevgiler.


Her ikinizede çok teşekkür ederim bu kadar açıklayıcı bir anlatım olamazdı :)
 

 

wmaraci
wmaraci

fruzgar fruzgar ProPvPServerlar Kimlik Onayı
  • Üyelik 06.02.2015
  • Yaş/Cinsiyet 28 / E
  • Meslek SD
  • Konum Ordu
  • Ad Soyad F** R**
  • Mesajlar 792
  • Beğeniler 258 / 257
  • Ticaret 11, (%100)

mts adlı üyeden alıntı

Bu yazdığınız yalnızca siteye giren arama motoru botlarını engelliyor diye düşünüyorum, zira robots.txt yalnızca bunlar için. Fakat httrack tarzı yazılımlar web sitesi içeriğini kopyalıyor yani gidip robots.txt dosyasına bakmadan, içeriği alıyor. (Bu benim bildiğim, yanlış biliyor olamazmıyım, olabilirim tabi ki de) Fakat, eğer apache kullanıyorsanız .htacces içerisinden, nginx kullanıyorsanız .conf içerisinden, Header'ında arkadaşın User-agent'larda örnek verdiği isimleri engellerseniz, taramaya, siteyi kopyalamaya başladıklarında boş sayfa ile karşılaşırlar.

Not: Yukarıdada belirttiğim gibi yazılımların içerisinde robots.txt sorgusu olup olmadığını bilmiyorum, olmayacağı kanaatindeyim, o yüzden daha kesin olan bir yöntemden bahsettim, fruzgar'ın bahsettiği şekildede olabilmesi mümkün. Saygılar, sevgiler.

Katılıyorum hocam ama sanırım robot.txt engelliyor çünkü ben bi sitede denemiştim ayıptır söylemesi :)

Httracki başlattığımda site yansıması alınamadı diye hata veriyordu. Araştırdığım da ise robots.txt dosyasında yukarıda vermiş olduğum kodları buldum. Arkadaş bu konuyu açtığında ise yukarıdaki bahsettiğim sitenin robots.txt sinden alıp yazdım. Ama dediğiniz gibi robots.txt değilde farklı bir engelleme de olabilir
 

 

monelogg monelogg <> Kullanıcı
  • Üyelik 06.03.2014
  • Yaş/Cinsiyet 33 / E
  • Meslek Öğrenci
  • Konum Diğer
  • Ad Soyad M** B**
  • Mesajlar 658
  • Beğeniler 78 / 125
  • Ticaret 0, (%0)
Merhaba.

https://github.com/bluedragonz/bad-bot-blocker/blob/master/.htaccess
 

 

Site Ayarları
  • Tema Seçeneği
  • Site Sesleri
  • Bildirimler
  • Özel Mesaj Al