lostyazilim
tr.link

Webarchiveden toplu makale çekebilir miyiz?

4 Mesajlar 903 Okunma
lstbozum
tr.link

BocekBasi BocekBasi WM Aracı Kullanıcı
  • Üyelik 26.05.2013
  • Yaş/Cinsiyet 36 / E
  • Meslek Sıradan
  • Konum Kahramanmaraş
  • Ad Soyad S** T**
  • Mesajlar 2842
  • Beğeniler 374 / 374
  • Ticaret 30, (%100)
Kapanan bir siteden toplu makale çekilebilir mi acaba arkadaşlar veya bir forumu tamamen?
 

 

https://dapasorgu.com
wmaraci
reklam

kelebek kelebek WM Aracı Kullanıcı
  • Üyelik 11.05.2013
  • Yaş/Cinsiyet 32 / E
  • Meslek Geliştirici
  • Konum Malatya
  • Ad Soyad E** K**
  • Mesajlar 3142
  • Beğeniler 60 / 764
  • Ticaret 5, (%100)
Bir bot yazarak çekebilirsin. Diğer yöntem web archive'nin sunduğu api'i kullanabilirsin. Limitleri ne kadar tam bir bilgim yok.


https://hackernoon.com/guide-to-handling-internet-archives-cdx-server-api-response-c469df5b81f4
BocekBasi

kişi bu mesajı beğendi.

BocekBasi BocekBasi WM Aracı Kullanıcı
  • Üyelik 26.05.2013
  • Yaş/Cinsiyet 36 / E
  • Meslek Sıradan
  • Konum Kahramanmaraş
  • Ad Soyad S** T**
  • Mesajlar 2842
  • Beğeniler 374 / 374
  • Ticaret 30, (%100)

kelebek adlı üyeden alıntı

Bir bot yazarak çekebilirsin. Diğer yöntem web archive'nin sunduğu api'i kullanabilirsin. Limitleri ne kadar tam bir bilgim yok.


https://hackernoon.com/guide-to-handling-internet-archives-cdx-server-api-response-c469df5b81f4


Nasıl kullanılıyor acaba hocam
 

 

https://dapasorgu.com

kelebek kelebek WM Aracı Kullanıcı
  • Üyelik 11.05.2013
  • Yaş/Cinsiyet 32 / E
  • Meslek Geliştirici
  • Konum Malatya
  • Ad Soyad E** K**
  • Mesajlar 3142
  • Beğeniler 60 / 764
  • Ticaret 5, (%100)

BöcekBaşı adlı üyeden alıntı

Nasıl kullanılıyor acaba hocam


Üsteki linkte verdiğim yazıyı çok basit şekilde çeviriyorum.

Öncelikle bu adrese gideceksiniz;
http://web.archive.org/cdx/search/cdx?url=

Bu adrese girdiğinizde bütün alınan sayfaları görebilirsiniz. Sonrasında en baştan 2. kısımda timestamp var. O timestamp'i alıp onu aşağıdaki url'ye gidebilirsiniz.

http://web.archive.org/web///

Sonrası bot ile veriyi ayıklama ve kayıt etme işlemi :)

Örnek olarak:
http://web.archive.org/cdx/search/cdx?url=eminkose.com
http://web.archive.org/web/20181011113150/https://eminkose.com/
 

 

wmaraci
wmaraci
Site Ayarları
  • Tema Seçeneği
  • Site Sesleri
  • Bildirimler
  • Özel Mesaj Al