lostyazilim
tr.link

Robots.txt ile ilgili tüm bilinmesi gerekenler!

16 Mesajlar 7.743 Okunma
acebozum
tr.link

trgy trgy Mühendis Kullanıcı
  • Üyelik 22.12.2010
  • Yaş/Cinsiyet 34 / E
  • Meslek Mühendis
  • Konum Macaristan
  • Ad Soyad T** Y**
  • Mesajlar 390
  • Beğeniler 32 / 209
  • Ticaret 16, (%100)
Arkadaşlar uzunca bir yazı oldu, açıkçası çok fazla araştırma yaptım yazıyı yazmak için ve güzel de bir makale ortaya çıktı. Yaklaşık 10 saatlik araştırmalar sonucunda yazılmış bir yazıdır o yüzden emeğe birazcık saygınız olsun ve eksiksiz okuyun. Basit gibi gözükse de çok ince detaylara değindim. Makaleyi sürekli güncel tutacağım.

Bu yazıda robots.txt ile ilgili rehber tadında bilgilere ve sıkça karşılaşılan hataların çözümlerine ulaşabileceksiniz. Şimdi öncelikle robots.txt dosyasının ne işe yaradığından ve neden kullandığımızdan bahsedelim. Robots.txt dosyası arama motorlarının internet sitenizde var olan hangi içeriklere ulaşıp ulaşmamasını söyleyebileceğiniz dosyadır. Basit bir örnek vermek gerekirse “siteadi.com/kategori/” isimli bir kategoriniz var ve bu kategorideki yazıların index almamasını istiyorsunuz. Bunu robots.txt ile yapabilirsiniz. Sitemap adresinizi de robots.txt dosyası içerisinde belirtip Google‘ın sıkça ziyaret ettiği robots.txt dosyasından erişimini sağlayabilirsiniz.


Robots.txt dosyasında 4 adet terime ihtiyacımız olacak. Bunlar User-agent, Allow, Disallow ve sitemap terimleridir. Bu terimlere belirli komutlar vererek arama motorlarına yön verip, komutlarımızı yerine getirmelerini sağlayacağız.

robots.txt bilinmesi gerekenler

Şimdi detaylara girmeden önce bir kaç şeyden bahsedeceğim. Öncelikle robots.txt dosyası sıralamanıza etki etmez, aslında etki eder nasıl etki eder yanlış kullanımlarda etki eder. Sitenizin index almasını yanlışlıkla kapatırsanız doğal olarak arama sonuçlarından silinirsiniz. Bir diğer değineceğim nokta ise dosyanızı oluştururken birşeylerden korkuyorsanız onu en basit haliyle yani Anasayfa dahil tüm içeriğinizi indexleterek bırakın.

robots.txt User-agent kullanımı dikkat edilmesi gereken noktalar

En önemli terimdir çünkü öncelik belirler. Örneğin iki farklı User-agent kullandınız, bir tanesinde * diğerinde ise Googlebot User-agent kullandınız. * olarak kullandığınız engelleme ve erişim izinleri Googlebot kısmında kullanılmadıysa Google * tarafındakileri reddeder, siz istemeseniz bile index aldırmaya devam eder. Örnek;


  • Anasayfa dahil tüm içeriği engelleme


User-agent: *
Disallow: /klasor/

User-agent: Googlebot
Allow: /


Yukarıda verdiğimiz örnekte “siteadi.com/klasor/” kısmını Yahoo, Yandex indexlemeyecek ama Google indexleyecektir, çünkü ona özel bir komut oluşturduk ve o genel olarak belirtilmiş komutları reddederek kendi komutlarına yöneliyor.

neden index alınmamasını arama motorlarının engellenmesini isteriz

Aslında bu sorunun cevabı oldukça basit, internet siteniz daha hazır olmadığı için, duplicate content yani tekrarlanan içerikleri engellemek için, gereksiz sayfaların ulaşılmasını engellemek için(fotoğraf galerisi, özel bilgileri bulunduran sayfalar vb.) ve gereksiz olabilecek resim, javascript gibi dosyalara arama motorlarının ulaşmasını engellemek gibi sebeplerden dolayı index alınmamasını isteriz.

açıklamalarıyla robots.txt kullanım örnekleri


  • Anasayfa dahil tüm içeriği engelleme



User-agent: *
Disallow: /



  • Anasayfa dahil tüm içeriğe izin ver



User-agent: *
Allow: /



  • Klasör , kategori ve ona bağlı içerikleri engelleme



User-agent: *
Disallow: /kategori/
Disallow: /klasor/


Not: Bu kullanımda siteadi.com/kategori/ ve siteadi.com/klasor/ dosyalarını ve buna bağlı olan siteadi.com/kategori/konu.html veya siteadi.com/klasor/resim.png gibi içerikleri engellemiş oluyoruz.


  • a harfi ile başlayan içerikleri engelleme



User-agent: *
Disallow: /a


Not: Bu kullanımda siteadi.com/a içeriğinin yanısıra a harfi ile başlayan siteadi.com/about içeriği de engellenmiş olur. Bu yüzden engellemeyi kullanırken lütfen dikkatli olalım.

robots.txt karşılaşılan hatalar ve çözümleri

Şimdi ise genellikle karşılaşılan robots.txt hatalarından bahsedelim ve çözümlerine hep birlikte göz atalım. Öncelikle hatalarınızı görebileceğiniz Google Webmaster Tools ortamındaki alandan bahsedelim. Eğer robots.txt dosyanızda herhangi bir hatanız var ise bunu açıkça aşağıdaki resimdeki alanda görebiliyorsunuz.



Yukarıda resimde gördüğünüz alanda hatalarınıza göz atabilirsiniz, herhangi bir hata yok ise aşağıdaki gibi bir görüntü ile karşılaşacaksınız.



Eğer robots.txt dosyanızdan emin değilseniz ve onu test etmek istiyorsanız yine aynı link üzerinde aşağıdaki resimdeki gibi test edebilirsiniz. Sonuç olarak sitenizin ana dizininin index almasına izin verdiyseniz İzin Verildi yazısıyla karşılaşırsınız.





detaylı karmaşık robots.txt kullanım örnekleri

Öncelikle uygulayacağınız komutlar konusunda çok dikkatli olmalısınız çünkü herhangi yapacağınız bir hata yüksek kayıplara neden olabilir. O yüzden denemelerinizi daha çok yedek sitelerinizde ve ya kullanmadığınız kişisel sitelerinizde deneyiniz. Aşağıdaki kullanım örneklerini her arama motoru desteklemiyor. Bildiğim kadarıyla sadece Bing ve Google tarafından destekleniyor


  • ? işareti içeren tüm linklerin index alınmasını engelleme



User-agent: *
Disallow: /*?


Not: ? işareti yerine a gibi bir harf koyarsanız a harfi içeren tüm içerikleri engelleyecektir.


  • .html ile biten tüm linklerin index alınmasını engelleme



User-agent: Googlebot
Disallow: /*.html$


Not: Sonu html ile biten tüm içeriklerin index almasını engelleyecektir.

robots.txt içerisinde noindex kullanımı

Biraz detaylı bilgilere girip robots.txt içerisinde noindex kullanımı gibi bir konuya değinmek istiyorum. Bir kaç yerde yaptığım araştırmaya göre bununla ilgili test yapıp olumlu sonuç alanlar da olmuş. Örneğin aşağıdaki gibi bir kullanımda sonucun normal döndüğünü yazmışlar fakat başka birisine göre ise kesinlikle noindex komutunun kullanılmaması gerektiğidir. Bunu söyleyen kişi ise Google çalışanıdır.

User-agent: Googlebot
Disallow: /konu/
Noindex: /konuadi-1/


Not: Yukarıdaki kullanımda siteadi.com/konuadi-1/ daha önce index aldıysa webmaster tools üzerinde hata gösterecektir eğer ki index almadan önce böyle bir komutu kullandıysak hata vermeyecek ve index almayacaktır. siteadi.com/konu/ ise index alsa da almasa da hata görünmeyecektir. İşte bu yüzden tartışma yaşanıyor diyebiliriz.

Şimdilik konu hakkında yazacaklarım bu kadar, konuyu sürekli güncelleyeceğim, aşağıda size detaylı ingilizce kaynakları iletiyorum. Siz de herhangi bir soru veya sorununuz olduğunda yorum kısmından yazmaya çekinmeyin.
Okeskin FreeWaLLe Demirci

kişi bu mesajı beğendi.

elektronikssl
webimgo

nbrknk22 nbrknk22 SEO UZMANI Kullanıcı
  • Üyelik 18.02.2014
  • Yaş/Cinsiyet 29 / E
  • Meslek SEO UZMANI
  • Konum İstanbul Anadolu
  • Ad Soyad H** E**
  • Mesajlar 2770
  • Beğeniler 1194 / 724
  • Ticaret 129, (%100)
Detaylı bir şekil de çok güzel anlatılmış teşekkürler.
 

 

https://www.dopinger.com/tr

semihsadi semihsadi www.onlinetahta.com Kullanıcı
  • Üyelik 04.07.2015
  • Yaş/Cinsiyet 35 / E
  • Meslek Kurucu
  • Konum Ankara
  • Ad Soyad S** K**
  • Mesajlar 348
  • Beğeniler 25 / 66
  • Ticaret 0, (%0)
Cok.faydali.olmus hocam tesekkur ederiz
 

 

http://onlinetahta.com -> Canlı Dershane- Video Dershane-Uzaktan Eğitim

Trablus Trablus Başarı = Doğru Strateji Kullanıcı
  • Üyelik 12.03.2017
  • Yaş/Cinsiyet 23 / E
  • Meslek Analist
  • Konum İstanbul Avrupa
  • Ad Soyad İ** S**
  • Mesajlar 255
  • Beğeniler 28 / 59
  • Ticaret 7, (%100)
Faydalı Bir İçerik Teşekkürler Hocam.
 

 

www.hizlikazanc.org
wmaraci
wmaraci

ekberali ekberali WM Aracı Kullanıcı
  • Üyelik 04.04.2017
  • Yaş/Cinsiyet 44 / E
  • Meslek İşçi
  • Konum Bursa
  • Ad Soyad A** E**
  • Mesajlar 62
  • Beğeniler 26 / 11
  • Ticaret 0, (%0)
Çok teşekkürler. Yandex botlar yüzünden geçtiğimiz günler de sıkıntılı günler geçirmiş biri olarak ilaç gibi geldi
 

 

facebook.com/AvkoliK

Meraklisi Meraklisi WM Aracı Kullanıcı
  • Üyelik 26.05.2017
  • Yaş/Cinsiyet 33 / K
  • Meslek Eticaret uzmani
  • Konum Ankara
  • Ad Soyad E** T**
  • Mesajlar 1
  • Beğeniler 1 / 1
  • Ticaret 0, (%0)
Içerik faydalı ancak paylaştığınız resimler mobilde goruntulenmemektedir.
vidanjorcu

kişi bu mesajı beğendi.

ReklamKap ReklamKap Faydalı olmak güzeldir. Kullanıcı
  • Üyelik 04.03.2015
  • Yaş/Cinsiyet 30 / E
  • Meslek Firma Rehberi
  • Konum Tekirdağ
  • Ad Soyad A** K**
  • Mesajlar 1478
  • Beğeniler 103 / 475
  • Ticaret 31, (%100)
Yazı sade ve anlaşılır. Seo kelimesinin anlamını bilen herkes robota.txt'yi öğrenebilir.
 

 

fth0707 fth0707 WM Aracı Kullanıcı
  • Üyelik 07.05.2017
  • Yaş/Cinsiyet 54 / E
  • Meslek elektronik
  • Konum Antalya
  • Ad Soyad F** S**
  • Mesajlar 79
  • Beğeniler 9 / 11
  • Ticaret 0, (%0)
Çok başarılı ve gayet net olmuş,eline sağlık
 

 

the the Mekatronik.net Kullanıcı
  • Üyelik 01.10.2014
  • Yaş/Cinsiyet 23 / E
  • Meslek Webmaster
  • Konum Çanakkale
  • Ad Soyad A** Ş**
  • Mesajlar 892
  • Beğeniler 282 / 269
  • Ticaret 0, (%0)
Hocam şimdi benim indexlenen bazı sayfaları nasıl kaldırabilirim? no index ile olurmu?
 

 

Mekatronik.net - Haber.red - Begeni.net - sms onay

HilalAzeri HilalAzeri WM Aracı Kullanıcı
  • Üyelik 10.11.2017
  • Yaş/Cinsiyet 34 / E
  • Meslek MesleyimYok
  • Konum Diğer
  • Ad Soyad H** H**
  • Mesajlar 14
  • Beğeniler 0 / 1
  • Ticaret 0, (%0)
tesekkur ederim guzel anlatim olmus hakketen
 

 

wmaraci
wmaraci
Konuyu toplam 1 kişi okuyor. (0 kullanıcı ve 1 misafir)
Site Ayarları
  • Tema Seçeneği
  • Site Sesleri
  • Bildirimler
  • Özel Mesaj Al