lostyazilim
tr.link

İçerik botlarının işini zorlaştırma projesi (İlk sınavınız burada)

37 Mesajlar 5.571 Okunma
acebozum
tr.link

    MrB MrB WM Aracı Kullanıcı
    • Üyelik 16.06.2014
    • Yaş/Cinsiyet 27 / E
    • Meslek öğrenci
    • Konum Kocaeli
    • Ad Soyad B** Ö**
    • Mesajlar 945
    • Beğeniler 87 / 262
    • Ticaret 1, (%100)
    Merhabalar,

    Çalıntı içerik problemiyle hemen hemen tüm site sahipleri karşılaşıyor.
    Bu problemi tamamen engellemek mümkün mü olmasa da hırsızların işini
    zorlaştırabilecek yöntemler bulunuyor.

    Bunlardan en zor çözülebilecek olan bazı önlemleri özel bir servis ile sunmayı planlıyorum. İlk ve kesinlikle alınabilecek en iyi önlemlerden biri olan DOM karıştırıcıyı yakında çok ama çok cüzi bir miktar eşliğinde yayınlayacağım.

    Sistemin işleyişi şu şekilde.

    WmAracı'nın üst menüsünde ki anasayfa yazısını alan bir bot hayal edelim.
    Bota verilecek komut oldukça basit #ustmenu ul .ilkmenu a img
    Bu veya benzeri bir gidiş yöntemi ile her elementin sınıf adı sabit ve belirli olduğu için bot her zaman istediği veriyi seçip alabiliyor.

    Benim yazdığım sistemse tüm web içeriğinin html ve css kodlarını eşitleyerek öngörülemez bir şekilde her seferinde baştan yaratıyor. Tasarımınız görüntü olarak aynı kalıyor ancak tüm elementler ve o elementlere bağlı css içinde ki seçiciler eş zamanlı olarak değişiyor.

    Şu örnek seçiciyi ele alalım. #ustmenu ul .ilkmenu a img

    Eğer bunu benim servisime atarsanız #p08sh zzxk2 .zjxc8 llk29 iusdg

    gördüğünüz üzere görüntü olarak anlamsız bir söz dizimi oluşuyor ve kullanıcılar sayfanızı ziyaret ettikleri her anda tüm elementler yukarıda ki gibi benzersiz bir şekilde yeniden yaratılıyor. Üstelik bunu sadece sınıf ve id verilerini değişerek değil tamamen elementleri değiştirip baştan yaratarak yapabiliyor.

    Ayrıca bunu yaparken kendi sunucunuza hiç bir ekstra yük binmiyor çünkü işlemi oluşturan yapı bizim özel servisimiz, siz sadece bize dönüştürülecek html çıktısı ve css kodlarını veriyorsunuz.

    BOTFUCKER.COM
    (Pek Yakında!)

     

     

    elektronikssl
    webimgo

    impjix impjix WM Aracı Kullanıcı
    • Üyelik 10.03.2013
    • Yaş/Cinsiyet 33 / E
    • Meslek Yazılım Mühendisi
    • Konum Ankara
    • Ad Soyad F** A**
    • Mesajlar 2426
    • Beğeniler 809 / 814
    • Ticaret 17, (%100)
    Hocam dmca falan işe yaramıyor mu
     

     

    MrB MrB WM Aracı Kullanıcı
    • Üyelik 16.06.2014
    • Yaş/Cinsiyet 27 / E
    • Meslek öğrenci
    • Konum Kocaeli
    • Ad Soyad B** Ö**
    • Mesajlar 945
    • Beğeniler 87 / 262
    • Ticaret 1, (%100)

    impjix adlı üyeden alıntı

    Hocam dmca falan işe yaramıyor mu


    impjix adlı üyeden alıntı

    Hocam dmca falan işe yaramıyor mu


    DMCA sizi içerik hırsızlığından eylem aşamasında direkt olarak korumaz.
    Sizi daha çok içerik çalıntısı olduğunu fark ettiğinizde hukuki süreç üzerinden korumaya çalışır.
     

     

    impjix impjix WM Aracı Kullanıcı
    • Üyelik 10.03.2013
    • Yaş/Cinsiyet 33 / E
    • Meslek Yazılım Mühendisi
    • Konum Ankara
    • Ad Soyad F** A**
    • Mesajlar 2426
    • Beğeniler 809 / 814
    • Ticaret 17, (%100)
    Hocam çalışma sistemini biliyorum. Bırakın içeriğinizi çalsın, ilk siz index alıyorsanız sıkıntı yok. Otoriter ve güçlü bi site çalıyorsa sizden onu da dmca ile halledebilirsiniz.
     

     

    wmaraci
    wmaraci

    MrB MrB WM Aracı Kullanıcı
    • Üyelik 16.06.2014
    • Yaş/Cinsiyet 27 / E
    • Meslek öğrenci
    • Konum Kocaeli
    • Ad Soyad B** Ö**
    • Mesajlar 945
    • Beğeniler 87 / 262
    • Ticaret 1, (%100)

    impjix adlı üyeden alıntı

    Hocam çalışma sistemini biliyorum. Bırakın içeriğinizi çalsın, ilk siz index alıyorsanız sıkıntı yok. Otoriter ve güçlü bi site çalıyorsa sizden onu da dmca ile halledebilirsiniz.


    İlk index atsanızda sıkıntı var maalesef, eğer içeriğinizi alabiliyorlarsa bu durumda sürekli olarak bot ziyaretçiler ile karşılaşabiliyorsunuz buda daha fazla veritabanı sorgusu daha fazla içi boş trafik anlamına geliyor.

    Ayrıca bir kaç küçük düzenlemeyle içerik alındıktan sonra telif dışına zorlanılmadan çıkılabiliyor.
     

     

    alicangrafik alicangrafik Üyeliği Durdurulmuş Banlı Kullanıcı
    • Üyelik 17.03.2019
    • Yaş/Cinsiyet 26 / E
    • Meslek Grafiker
    • Konum Giresun
    • Ad Soyad A** A**
    • Mesajlar 262
    • Beğeniler 122 / 100
    • Ticaret 3, (%100)
    Bütün css ve html kodlarını kırılması zor şifreleme yöntemleri ile (üzerinde uğraşarak) şifreleyip kendimizde başka bir kaynaktan çekebiliriz. Farklı olarak siz ne vaat ediyorsunuz ki? Bilgilendirseniz sevinirim. Güzel bir proje gibi gözüküyor, kolay gelsin.
    musbay

    kişi bu mesajı beğendi.

    Blacksheep Blacksheep .NET Developer Kullanıcı
    • Üyelik 20.07.2014
    • Yaş/Cinsiyet 28 / E
    • Meslek Webmaster
    • Konum Ankara
    • Ad Soyad M** K**
    • Mesajlar 2074
    • Beğeniler 60 / 532
    • Ticaret 10, (%100)
    Bütün botlar element id veya sınıfına göre çalışmaz. Xpath CssSelector gibi şeyler için nasıl önlem alacaksınız :)
     

     

    Fizello - Inspired by Colors

    MrB MrB WM Aracı Kullanıcı
    • Üyelik 16.06.2014
    • Yaş/Cinsiyet 27 / E
    • Meslek öğrenci
    • Konum Kocaeli
    • Ad Soyad B** Ö**
    • Mesajlar 945
    • Beğeniler 87 / 262
    • Ticaret 1, (%100)

    alicangrafik adlı üyeden alıntı

    Bütün css ve html kodlarını kırılması zor şifreleme yöntemleri ile (üzerinde uğraşarak) şifreleyip kendimizde başka bir kaynaktan çekebiliriz. Farklı olarak siz ne vaat ediyorsunuz ki? Bilgilendirseniz sevinirim. Güzel bir proje gibi gözüküyor, kolay gelsin.


    Merhaba,

    Bu tarz bir yapıyı sağlıklı ve kusursuz bir şekilde işletebilmeniz için direkt html string bir veriyi işlemek yeterli olmayabiliyor. Benim geliştirdiğim yapı verdiğiniz DOM elementleri ile css kodlarını arkaplanda simule ettikten sonra element değişikliklerini gerçekleştirip size çıktıyı veriyoruz.

    Basit bir bloğunuz olduğunu varsayarsak, eğer bu işlemi her defasında kendi içinizde yapmaya kalkarsanız, var olan kaynak tüketiminizi 2-3 kat arttırmış olacaksınız.
    Ayrıca olası bir tarayıcı güncellemesinde değişen veya yeni eklenen bir element varsa yeniden gözden geçirip sistememe katmanız gerekecek çünkü sadece sınıf isimleri gibi basit şeyleri değiştirmiyoruz, tüm element yapısını baştan yaratıyoruz.

    Örneğin tagı normalde varsayılan bir stile sahip biz bunu bambaşka bir elemente çevirdiğimizde bu varsayılan stil yapısını ona da tanımlıyoruz. Olası tarayıcı güncellemelerini takip edip sürekli olarak düzenleme yapmanız gerekecektir.
     

     

    MrB MrB WM Aracı Kullanıcı
    • Üyelik 16.06.2014
    • Yaş/Cinsiyet 27 / E
    • Meslek öğrenci
    • Konum Kocaeli
    • Ad Soyad B** Ö**
    • Mesajlar 945
    • Beğeniler 87 / 262
    • Ticaret 1, (%100)

    Blacksheep adlı üyeden alıntı

    Bütün botlar element id veya sınıfına göre çalışmaz. Xpath CssSelector gibi şeyler için nasıl önlem alacaksınız :)


    Kullanıcı hareketlerini arkaplanda analiz eden ve bot olup olmadıklarına karar veren bir yapı ile bu sistemi destekliyoruz.

    Ayrıca xpath kullanarak bile içinden veri seçmeniz gerçekten çok zor olacak.
    bir resim arıyorsanız, kaynak kodlarında bir resim kodu göremeyeceksiniz.
    bir paragraf arıyorsanız, kaynak kodlarında paragraf elementini de göremeyeceksiniz.

    Kaynağa her bakışınızda öncekinden tamamen farklı bir yapı göreceksiniz.
     

     

    Blacksheep Blacksheep .NET Developer Kullanıcı
    • Üyelik 20.07.2014
    • Yaş/Cinsiyet 28 / E
    • Meslek Webmaster
    • Konum Ankara
    • Ad Soyad M** K**
    • Mesajlar 2074
    • Beğeniler 60 / 532
    • Ticaret 10, (%100)
    Sistemi kurduğunuzda üzerinde test işlemleri için mesaj atarsanız çok sevinirim :)
     

     

    Fizello - Inspired by Colors
    wmaraci
    wmaraci
    Konuyu toplam 4 kişi okuyor. (0 kullanıcı ve 4 misafir)