lostyazilim
tr.link

Google'ın PDF Sayfalarını İndeksleme Mantığı?

5 Mesajlar 1.247 Okunma
acebozum
tr.link

Gerbelas Gerbelas WM Aracı Kullanıcı
  • Üyelik 15.02.2014
  • Yaş/Cinsiyet 41 / E
  • Meslek Serbest
  • Konum Malatya
  • Ad Soyad R** Ö**
  • Mesajlar 319
  • Beğeniler 73 / 73
  • Ticaret 10, (%100)
Merhaba arkadaşlar,
Blogger tabanlı bir site açtık. Kendi hazırladığımız matematik testlerini PDF olarak google drive'a yükleyip bir satırlık kodu alıp blogger'a yapıştırıp yayınlıyoruz. Yazıda bir alan oluşuyor ve PDF sayfası buradan görüntüleniyor. Merak ettiğim şu:

-Google, bu pdf içindeki özgün soruları indeksliyor mu, yani başkası bu soruları çalacak olsa kopyalamış sayılacak mı?
-PDF'deki soru sayısı ne kadar çok olursa o kadar zengin içerik mi sayılacak?
 

 

elektronikssl
webimgo

Teknobilim Teknobilim WM Aracı Kullanıcı
  • Üyelik 25.03.2012
  • Yaş/Cinsiyet 36 / E
  • Meslek Dış Ticaret Uzmanı ve Mühendis
  • Konum İstanbul Avrupa
  • Ad Soyad M** A**
  • Mesajlar 365
  • Beğeniler 44 / 104
  • Ticaret 64, (%100)
Google pdf dosyalarını da inceler fakat önemli bir mesele var scanner dan elde edilmiş pdf ile word, excel gibi uygulamalarda oluşturulmuş pdf dosyası aynı ulaşılabilirliği sağlamaz. Scanner ile elde edilen resim gibi algılanır ve resmin içindeki yazı aramalarda üst sıralara kolay kolay çıkamaz.
Şöyle düşünün yüklediğiniz pdf in içind istediğiniz bir yazıyı kopyalayıp metin editörüne yapıştırabiliyor musunuz ?

Bunun bir çözümü de var pdf to text tarzında hizmet veren web siteleri var fakat, başarı oranları 100% değil ve çoğu tam hizmet için ücret talep ediyor.
Gerbelas blogtecrubem nettebugun1

kişi bu mesajı beğendi.

Gerbelas Gerbelas WM Aracı Kullanıcı
  • Üyelik 15.02.2014
  • Yaş/Cinsiyet 41 / E
  • Meslek Serbest
  • Konum Malatya
  • Ad Soyad R** Ö**
  • Mesajlar 319
  • Beğeniler 73 / 73
  • Ticaret 10, (%100)
Sayın Teknobilim,
Çok teşekkür ederim. PDF'leri word üzerinden oluşturuyoruz, yani içindeki yazıyı kopyalama imkanı var. Ama yayınladığımız içerikteki normal yazılar indekslenmesine rağmen PDF içindeki yazılar indekslenmemiş görünüyor. Zaten içerikte gömülü olan pdf'ye tıklandığında bu pdf dosyası Google Drive sitesi üzerinden görüntüleniyor.

Sanırım hazırladığımız soruların ilk indeks sahibi olmamız için bir çözüm yok. Tekrar teşekkürler.
 

 

Teknobilim Teknobilim WM Aracı Kullanıcı
  • Üyelik 25.03.2012
  • Yaş/Cinsiyet 36 / E
  • Meslek Dış Ticaret Uzmanı ve Mühendis
  • Konum İstanbul Avrupa
  • Ad Soyad M** A**
  • Mesajlar 365
  • Beğeniler 44 / 104
  • Ticaret 64, (%100)
Rica ederim. Pdf'leriniz google drive üzerinden değil direkt tarayıcada açılsa daha iyi olur. Örnek bir link vereyim: https://www.tubitak.gov.tr/tubitak_content_files/BIDEB/proje_yarismasi/yardimDokumani/pdf_yardim_dokumani.pdf bu linke google da "nasıl yapılır .pdf" yazarak ulaşabilirsiniz. Google sonucunun yanında PDF simgesi vardır. Mantıken pdf ile de içerik üretilebilir ve indeks alabilirsiniz.

Buna karşın en sağlıklısı ise tabi ki pdf e bulaşmadan site içeriğinne text girmektir diye düşünüyorum.
Gerbelas

kişi bu mesajı beğendi.

wmaraci
wmaraci

Gerbelas Gerbelas WM Aracı Kullanıcı
  • Üyelik 15.02.2014
  • Yaş/Cinsiyet 41 / E
  • Meslek Serbest
  • Konum Malatya
  • Ad Soyad R** Ö**
  • Mesajlar 319
  • Beğeniler 73 / 73
  • Ticaret 10, (%100)
Bir bakalım hocam. Yardımlarınız için teşekkürler.
 

 

wmaraci
wmaraci
Konuyu toplam 1 kişi okuyor. (0 kullanıcı ve 1 misafir)
Site Ayarları
  • Tema Seçeneği
  • Site Sesleri
  • Bildirimler
  • Özel Mesaj Al