Herkese selamlar

Konuyu ele aldım çünkü;

Hem Google'da bunun üzerine patent almış hem de halen üzerinde çalıştığım LSI konusunda atıfta bulundum...
(Yani hazırlık aşamasındaki konularımda geçen bazı teknik bilgilere şimdiden yer veriyorum.)

Her dilin kendine göre etkisiz kelimeler listesi var.

"Çok fazla kullanılan kelimeler" anlamına geliyor. Bizde "bir", "ile", "ve" gibi kelimeler başı çekiyor. Bizi ilgilendiren bölümüyse arama motorlarının bu kelimeleri nasıl gördüğü ve ne yaptıkları ile ilgili kısmı.



Tek başlarına bir anlam ifade etmiyorlar.

Makaleler indekslenmeden önce kategorisinin belirlenmesi gerekir. Belirlenme işlemi öncesindeyse ilgili metnin tamamı bir dizi işlemden geçer. Tüm metnin küçük/büyük harfe dönüştürülmesi, noktalama işaretlerinin ve etkisiz kelimelerin filtrelenmesi gibi. Bu filtreleme işlemleri sonunda elde edilen metindeki her kelimenin 3-4 kelime sol ve sağlarındaki kelimelerle aralarındaki ilişkiler hesaplanır. Tabi bende prof değilim, o yüzden fazla uzatmayalım, yoksa yine evin yolu kaybolacak. Yani sonuçta metnin ne anlatmak istediği anlaşılarak ilgili kategorizasyon sağlanıyor.




Etkisiz Kelimeler Üzerindeki Bazı Gözlem Sonuçları

    [*]Özgünleştirme girişimlerini suya düşürüyor. Zaten etkisiz durumdaki bu kelimelerin değiştirilmesiyle yeni makaleler falan elde edilmiyor. Şöyle ki; "veya" kelimesi alınıp "ya da" olarak değiştiriliyor. Yaaa zaten bu kelimeler iptal ediliyor. Eeee neyin nesi değişti şimdi. Yerse işte :)
    [*]Çok kullanılmaları, cümlelerin uzatılması anlamına geliyor, ki bunun anlamı da o metnin otoriterlik barındırmıyor olabileceği sonucunu doğurur. Yani fazlası hem ziyaretçiyi hem de botları boşa oyalayıp zarar veriyor.
    [*]Anahtar kelime yoğunluğu üzerinde kararsızlığa yol açıyor.
    [*]Bağlaç kullanarak yapılan iki kelimelik bir aramada gelen sonuçlar ile bağlaçsız yapılan aramalara ilişkin sonuçlar çokta farklı değil. Yani Sayfa Başlıkları içinde kullanılması, sonuçlar üzerinde yüksek etkiler yaratmıyor (Örnek: "kırmızı ve siyah" ile "kırmızı siyah" aranmaları) Yani "etkisiz kelimeler ziyaretçiler içindir" diyebiliriz.


Bu sayfanın amacı, konuyu derinleştirmek değil, yüzeysel de olsa bilgi vermektir. Konuyu incelemek isteyenlere örnek oluşturması için akademik makaleler incelenebilir. (Etkisiz kelimelerden daha önce seo uyumlu makale konusunda da bahsetmiştik)

Farklı dillerde içerik sunan site sahiplerinin faydalanmak isteyebilecekleri 29 dildeki listeye Google Code'da burada yer verilmiş (Liste en son 2014'de güncellenmiş) inceleyebilirsiniz. Ayrıca konunun önemi açısından Google'ın verilerin karşılaştırılması amacıyla etkisiz kelime ve ifadelere ilişkin almış olduğu patenti de buradan inceleyebilirsiniz. Faydalı olabileceği düşüncesiyle Türkçe'deki etkisiz kelimeler listesi için ben de Türk Dil Kurumu'ndan destek aldım ve 200'e yakın kelime çıktı, buyrun;


Alfabetik Olarak Türkçe Etkisiz Kelimeler Listesi

A
acaba, ama, ancak, artık, asla, aslında, az

B
bana, bazen, bazı, bazıları, bazısı, belki, ben, beni, benim, beş, bile, bir, birçoğu, birçok, birçokları, biri, birisi, birkaç, birkaçı, birşey, birşeyi, biz, bize, bizi, bizim, böyle, böylece, bu, buna, bunda, bundan, bunu, bunun, burada, bütün

C
çoğu, çoğuna, çoğunu, çok, çünkü

D
da, daha, de, değil, demek, diğer, diğeri, diğerleri, diye, dolayı

E
elbette, en

F
fakat, falan, felan, filan

G
gene, gibi

H
hangi, hangisi, hani, hatta, hem, henüz, hep, hepsi, hepsine, hepsini, her, her biri, herkes, herkese, herkesi, hiç, hiç kimse, hiçbiri, hiçbirine, hiçbirini

İ
için, içinde, ile, ise, işte

K
kaç, kadar, kendi, kendine, kendini, ki, kim, kime, kimi, kimin, kimisi

M
madem, mı, mi, mu, mü

N
nasıl, ne, ne kadar, ne zaman, neden, nedir, nerde, nerede, nereden, nereye, nesi, neyse, niçin, niye

O
ona, ondan, onlar, onlara, onlardan, onların, onu, onun, orada, oysa, oysaki

Ö
öbürü, ön, önce, ötürü, öyle

S
sana, sen, senden, seni, senin, siz, sizden, size, sizi, sizin, son, sonra, seobilog

Ş
şayet, şey, şimdi, şöyle, şu, şuna, şunda, şundan, şunlar, şunu, şunun

T
tabi, tamam, tüm, tümü

Ü
üzere

V
var, ve, veya, veyahut

Y
ya, ya da, yani, yerine, yine, yoksa

Z
zaten, zira



Konuyu ayrıca detaylandırmak isteyenler Wikipedia'nın StopWords sayfasını ve sayfadaki diğer ilgili bağlantıları da takip ederek inceleyebilirler.


Güncel Kaynak : Etkisiz Kelimeler


Sevgiler
.