Bir Makalenin Yapay Zeka İle Yazılıp Yazılmadığı Nasıl Anlaşılır?


Spam içerikli, düşük kaliteli içeriği caydırmak için Google, üretici içerik yayınlayan siteleri cezalandırmaya başladı. Google dünyasının ötesinde, akademisyenler ve diğer profesyoneller yapay zeka tarafından oluşturulan içerikte büyük bir artış gördü. Bu nedenle, akademik, profesyonel veya sıradan bir ortamda içerikle karşılaşsanız da, belirli içeriğin başka bir insan tarafından yazıldığını doğrulamak için bir yol isteyebilirsiniz. Ama nasıl söyleyebilirsin?
Aylarca içeriği manuel olarak analiz ettikten sonra, kullanılan yapay zekanın karmaşıklığına bağlı olarak kendimi hâlâ şaşkın buluyorum. Çoğu yapay zeka aracının bir üniversite lisans düzeyinden sonra yazabileceğini düşünmesem de, gerçek ve oluşturulmuş içerik arasında sıralama yapabilmek isterim. Neyse ki, bir metnin yapay zeka tarafından yazıp yazılmadığını belirlemek için kullanabileceğiniz birkaç araç ve manuel yöntem var.





İşte 2023'te AI içeriğini tespit etmek için kişisel en iyi ipuçlarım ve araçlarım:

Yöntem 1: Ölçekli AI Dedektöründe İçerik (rastgele yazma)


Content at Scale'deki ekip kısa bir süre önce ücretsiz bir AI dedektörü yayınladı ve bu, AI yazısını hızlı bir şekilde tespit etmek için en iyi araç. Araç, milyarlarca sayfalık veri üzerinde eğitilmiştir ve bir seferde 25 bine kadar karakteri test edebilir.
Aracı kullanmak için, yazıyı algılama alanına yapıştırın ve algılama için gönderin. Sadece birkaç saniye içinde bir insan içerik puanı (metnin bir insan tarafından yazılma olasılığı) göreceksiniz ve içeriğinizin hangi bölümlerinin şüpheli veya bariz yapay zeka olduğuna dair satır satır döküm alacaksınız.

❗️
Akademik, profesyonel veya ticari içeriği test etmek mi istiyorsunuz? Originality'ye göz atın . Ciddi içerik yayıncıları, editörler veya akademisyenler için oluşturulmuş, hem intihal hem de yapay zeka dedektörü olarak çalışan bir araç arıyorsanız, bu sizin aracınız.

Yapay zeka tahmininin nasıl çalıştığının büyük bir kısmı, kalıpları yeniden oluşturmaya çalışmaktır . Modeller harika göstergelerdir çünkü yapay zeka oluşturucular, mevcut kalıplara en iyi "uygun" olanı üretmek için onları tanıma konusunda kelimenin tam anlamıyla eğitilirler. Metniniz mevcut verilerle ne kadar çok eşleşirse, oluşturulma olasılığı o kadar yüksek olur.
Aşağıda , insan yazısına kıyasla bir ChatGPT çıktısı arasındaki iki ekran görüntüsü bulunmaktadır. Testten sonra ayrıca bir öngörülebilirlik, olasılık ve desen puanı görürsünüz. Bu puanlar, perde arkasında neler olup bittiğinin basitleştirilmiş bir açıklamasıdır. İnsan yapımı yazı pek tahmin edilebilir değildir çünkü her zaman kalıpları takip etmez. AI yazımı tam tersidir, sadece kalıpları bilir.




Bu iki alıntıyı okuyun ve yazıdaki farkı belirleyip belirleyemeyeceğinize bakın. İlki çok profesyonel görünüyor, ancak bir sonraki cümlenin ne hakkında olacağını neredeyse hissedebiliyorsunuz. İnsan sonucu çok daha dağınıktır. Hala iyi bir yazı - sadece içinde daha fazla yaratıcılık var. Neler olup bittiğine dair son derece doğru, satır satır bir açıklama istiyorsanız, Geniş Ölçekte İçerik'e bakın .

Yöntem 2: Originality.ai (profesyonel yazı)


Yazının hem intihal mi yoksa yapay zeka ile mi yazıldığını belirleyecek sektör lideri bir içerik denetleyicisi arıyorsanız Originality'ye göz atın . Bu araç, içeriğin öngörülebilir görünüp görünmediğini belirlemek için GPT-3 ve diğer doğal dil modellerinin (hepsi büyük miktarda veri üzerinde eğitilmiş) bir kombinasyonunu kullanır. Orijinallik , hem ChatGPT hem de GPT 3.5 (en gelişmiş üretken dil araçları) için doğru olan tek resmi olmayan AI içerik algılama aracı gibi görünüyor .
100 kelime başına 0,01'den başlayan fiyatlandırmayla, daha profesyonel, sektör düzeyinde bir içerik algılama denetleyicisi arıyorsanız oldukça makul. Onunla iyi şanslar yaşadım ve üretim seviyesi kopyayı kontrol ederken kullanmaya devam edeceğim.
Originality'yi kullanmak için içeriği denetleyiciye yapıştırın ve tarayın. Örnek olarak, bu makaleyi ilk yayınladıktan yaklaşık iki hafta sonra orijinalliğe geri döndüm ve sonuçları görmek için yukarıdaki paragrafa girdim (benim tarafımdan ve herhangi bir AI kullanmadan yazılmış) ve sonuçlar şunlardı:
Yeterince etkileyici bir şekilde, içeriği "kopyaladığım" tam blogu bulabildi ve metni AI ile yazılma olasılığı düşük olarak işaretledi. Bu makaleyi bu kadar çabuk bulabilmesinden dürüstçe etkilendim. Ne pahasına olursa olsun, yapay zeka tespitini bir intihal denetleyicisiyle birleştirmek, yazılı içeriğin kökeni konusunda daha da emin olmanın gerçekten sağlam bir yoludur.
Yazmayı otomatikleştirmek ve kolayca test etmek isteyen herkes için Originality benim vazgeçilmez aracım oldu. Geniş Ölçekte İçerik'ten farklı olarak Originality, taramalarınızı hesap kontrol panelinizde de kayıtlı tutar. Birden çok içeriği sık sık yeniden ziyaret etmeniz gerekiyorsa bu harikadır. Unutmayın, hiçbir şey gerçekten kesin değildir ve bunu vurgulamak istiyorum.
Ayrıca, AI algılama puanı, makalenin AI olan yüzdesini değil, seçilen yazının AI olma şansını temsil eder. Bu örnekte Originality, bu paragrafın bir insan tarafından yazıldığından %94 emin. Dilediğin gibi al!

Kabul Edilebilir Tespit Puanları


Originality'nin CEO'suna göre, içerik sürekli olarak %10'un altındaysa, neredeyse kesin olarak nettir! Yalnızca içerik %40 veya %50'ye yaklaştığında AI, kaynağı hakkında şüphelenmeye başlamanız gereken zamandır.
Girdiğiniz daha uzun numune, tespitin daha doğru olma şansını artırır (daha büyük numune boyutları = daha güvenilir tespit) – ve güvenilirlik, doğruluk anlamına gelmez! Ek olarak, aynı yazar tarafından ne kadar çok içerik tararsanız, yazılarının meşru olup olmadığına karar verirken size daha iyi bir fikir verecektir.




Bazı sonuçlar yanlış pozitifler ve yanlış negatiflerle sonuçlanacağı için dikkatli olun. Tek bir makale veya metin parçacığı hakkında hüküm vermektense, bir dizi makaleyi incelemek ve bir yazara/hizmete başvurmak çok daha iyidir.

Tüm Siteleri Kontrol Etme


Tutarlı bir şekilde yüksek veya düşük algılama puanları varsa, bu sizin yapay zeka ile yazılmış içeriğin en büyük göstergesi olmalıdır. Tek bir makale, tüm bir web sitesinin (veya birden fazla içerik belgesinin) yapay zeka yardımıyla yazılıp yazılmadığını belirlemek için yeterli kanıt değildir. Bu algılama araçlarını biraz tereddütle almak da önemlidir (Bunu yeterince vurgulayamıyorum!). Bir kaynaktan ne kadar çok makale kontrol ederseniz, o kadar çok istatistiksel örnek elde edersiniz, ancak bir web sitesinin yapabileceklerinin ötesinde pek çok faktör tespit edilir. Bu faktörlerden bazıları, aşağıda ele alacağımız sözdizimi, tekrar ve karmaşıklık eksikliğini içerir. Originality kısa süre önce tüm web sitelerini aynı anda kontrol etmek için bir araç tanıttı.

Yöntem 3: Dev Dil Modeli Test Odası (gündelik yazı)


MIT-IBM Watson Yapay Zeka laboratuvarından ve Harvard NLP grubundan üç araştırmacı, makine tarafından oluşturulan metin içeriğini algılamaya yardımcı olmak için Dev Dil Modeli Test Odası (veya kısaca GLTR ) adlı harika bir ücretsiz araç oluşturdu . GLTR, şu anda metnin rastgele bölümlerinin yapay zeka ile yazılıp yazılmadığını tahmin etmenin en kolay yoludur. GLTR'yi kullanmak için, bir metin parçasını kopyalayıp giriş kutusuna yapıştırmanız ve "analiz" düğmesine basmanız yeterlidir. Bu araç GPT-2 ile oluşturulmuştur, yani GPT-3 içeriğiyle yazılmış kadar kapsamlı bir şekilde eğitilmeyecektir . Ancak yine de, kolayca oluşturulmuş içeriği görsel olarak aramak için harika bir yol olarak çalışır (ipucu ipucu: AI ).

Araç, metnin bir yapay zeka tarafından oluşturulmuş olma olasılığının ne kadar yüksek olduğuna dair size bir tahmin verecektir. GLTR'nin arkasındaki teknik ayrıntılar hakkında daha fazla bilgi edinmek isterseniz, resmi web sitelerinde daha fazlasını okuyabilirsiniz . Her kelime, soldaki bağlam göz önüne alındığında, her kelimenin tahmin edilen kelime olma olasılığına göre analiz edilir. Sözcük tahmin edilen ilk 10 sözcük içindeyse, arka plan yeşil, ilk 100 için sarı, ilk 1000 kırmızı, aksi takdirde mor renkte olacaktır. Çok fazla yeşille dolu içerik görürseniz, muhtemelen bir yapay zeka tarafından oluşturulmuştur.
📕
GLTR'yi Anlamak: Renk sayısı değerini ayarlayabilirsiniz (veya varsayılan olarak 10, 100, 1000 olarak tutabilirsiniz). Bir öncekinden sonraki kelime GLTR tarafından tahmin edilen ilk 10 kelime listesinde yer alıyorsa, yeşil olacaktır. İlk 100, sarı vb. GLTR, öngörülebilirliği vurgulayarak çalışır. Bir sonraki kelimeyi tahmin etmek ne kadar kolaysa, yapay zeka tarafından yazılmış olma olasılığı o kadar yüksektir.
Burada, bir yapay zeka tarafından yazılan bir makale ile bir insan tarafından yazılan bir makalenin bir bölümünün yan yana karşılaştırması var. AI tarafından oluşturulan metnin, insan tarafından yazılan metinden çok daha yeşil olduğunu görebilirsiniz.
Yine, kusursuz değil ama çok iyi bir gösterge. GLTR'nin AI içeriğini belirlememiz için harika bir görsel araç olduğunu söyleyebilirim , ancak size kesin bir puan vermiyor. Bildirim niteliğinde değil (bunu istediğiniz gibi alın). "Evet, bu muhtemelen yapay zekadır" diyen bir yüzde veya sayı almayacaksınız. Bir metin grubunu basitçe yapıştırarak, bunun bir yapay zeka tarafından yazılmış olma olasılığı hakkında iyi bir fikir edinebilirsiniz , ancak son çağrı kendi yargınıza dayanmalıdır. Jasper , Hyperwrite ve Lex ile karşılaştırıldığında kullanıldığını görmek ister misiniz ? Hazırladığımız bu videoyu izleyin:

Yöntem 4: OpenAI Sınıflandırıcı (OpenAI tarafından yapılmıştır)


OpenAI, bir şeyin AI (özellikle ChatGPT ) ile yazılıp yazılmadığını belirlemek için kendi dil sınıflandırıcısını yayınladı . Çok güvenilir olmasa da şirket, araçlarını yapay zeka ile bir şeyler yazıp yazmadığınızı belirlemek için içgörü sağlamak için kullanabileceğinizi iddia ediyor. Araç, ChatGPT ile aynı şirket tarafından yapılmış olsa da OpenAI, test ettikleri yapay zeka ile yazılmış örneklerin yalnızca %26'sının doğru şekilde yapay zeka olarak tanımlandığını iddia ediyor.
Sınıflandırıcıyı burada kullanabilirsiniz . En az 1000 karakter gerektirir ve daha büyük metin parçalarında çok daha iyi sonuç verir. Ayrıca, her zaman tahmin edilebilir olan metin güvenilir bir şekilde tanımlanamaz. Bu, şarkılar veya matematik denklemleri gibi şeyleri içerir, çünkü her cevap her zaman aynı olacaktır. Sınıflandırıcının kullanıma sunulmasıyla birlikte, ChatGPT ile ilgili son zamanlarda yaşanan tüm patlamanın üstesinden gelmeye ve sindirmeye çalışan eğitimciler için bazı yönergeler geldi.




Sınıflandırıcıyı kullanmak için, girdiye bir metin makalesi yapıştırmanız ve "gönder"i tıklamanız yeterlidir. Örnek düğmelerine tıklarsanız, metin alanına örnekleri otomatik olarak dolduracaktır.
Peki... sınıflandırıcı ne kadar iyi çalışıyor?
Birkaç hafta önce yazdığım bir makaleyi girdim ve "yapay zeka tarafından üretilmesi pek olası değil" sonucunu aldım (bu doğru). Bundan sonra, sınıflandırıcıyı yazarak bazı ChatGPT'leri test ettim ve "muhtemelen yapay zeka tarafından üretildi" ile sonuçlandı. Şimdiye kadar iyi görünüyor, değil mi?
Sonra ChatGPT'den iki çıktı daha test ettim ve "söyleyemiyorum" ve "yapay zeka tarafından yazılmış olması pek olası değil" hatalarını aldım. Yani gerçekten bir yazı tura gibi görünüyor.




OpenAI tarafından piyasaya sürüldüğünden beri ilk olarak bu tespit yöntemini önerdim. Umarım önümüzdeki birkaç ay içinde çok daha iyi olacak. Bir sonuç muhtemelen/büyük olasılıkla AI olarak geri dönerse , bunun genellikle AI ile üretildiğini fark ettim . Araç, başlangıçta onu yakalamakta her zaman harika bir iş çıkarmaz. Umudum var, ancak şu ana kadar ne kadar belirsiz göründüğüne bağlı olarak, Dürüst olmak gerekirse onunla daha tutarlı sonuçlar aldığım için Originality'ye bağlı kalacağım .

Yöntem 4: Teknik İşaretler


Bir içeriğin yapay zeka tarafından üretilip üretilmediğini anlamanın bir sonraki yolu, yazının teknik yönlerine bakmaktır. Bu o kadar somut değildir ve bariz görünebilir, ancak önceki araçlarla ilgili sorun yaşıyorsanız veya karşılaştığınız yazıları daha ayrıntılı olarak incelemek istiyorsanız, içeriğe derinlemesine bakmalısınız. İşte aranacak birkaç şey:
1. Kapsamlı cümlelerin uzunluğu: AI tarafından oluşturulan içerik genellikle çok kısa cümleler içerir. Bunun nedeni, AI'nın insan yazısını taklit etmeye çalışması, ancak henüz kapsamlı cümle karmaşıklığında tam olarak ustalaşmamış olmasıdır . Kod veya adım adım talimatlar gerektiren bir şey hakkında teknik bir blog okuyorsanız, bu acı verici bir şekilde açıktır. Henüz yapay zekanın Turing testini geçebileceği noktada değiliz. İçeriği GLTR veya Originality kullanarak test ettiyseniz ve içerik yaratıcı ve benzersizse, bunun açık olduğunu söyleyebilirim. Daha fazla araştırmanız gereken, kendinden emin bir şekilde şüpheli görünen teknik içeriktir .
2. Sözcüklerin ve tümcelerin tekrarı: Yapay zeka tarafından oluşturulan içeriği tespit etmenin başka bir yolu da sözcüklerin ve tümcelerin tekrarına bakmaktır. Bu, AI'nın alanı alakalı anahtar kelimelerle doldurmaya çalışmasının sonucudur (diğer bir deyişle - ne hakkında konuştuğunu gerçekten bilmiyor). Dolayısıyla, bir makale okuyorsanız ve aynı kelimenin tekrar tekrar kullanıldığını hissediyorsanız, bunun bir yapay zeka tarafından yazılmış olma olasılığı daha yüksektir. Spam içerikli AI nesil SEO araçlarından bazıları, anahtar kelime doldurma makalelerini sever. Anahtar kelime doldurma, bir kelimeyi veya kelime öbeğini o kadar çok tekrarladığınızda kulağa doğal gelmiyor. Bazı makaleler, diğer tüm cümlelerde olduğu gibi, hedef anahtar kelimelerine sahiptir. Bir kez fark ettiğinizde, makaleye odaklanamayacaksınız. Aynı zamanda okuyucular için son derece itici.




3. Analiz eksikliği: Bir makalenin yapay zeka tarafından yazıp yazılmadığını anlamanın üçüncü bir yolu, karmaşık analizden yoksun olup olmadığıdır. Bunun nedeni, makinelerin veri toplamada iyi olması, ancak onu anlamlı bir şeye dönüştürmekte o kadar iyi olmamasıdır. Bir makale okuyorsanız ve bunun gerçek bir içgörü veya analiz içermeyen bir gerçekler listesi olduğunu düşünüyorsanız, makalenin yapay zeka ile yazılmış olma ihtimali daha da yüksektir. ChatGPT ile, AI'nın yazmayı analiz etmeye başlayabileceği noktaya yaklaşıyoruz, ancak yanıtları hala çok "robotik" buluyorum. İnsanlar, tweet'lere yanıt vermek için yapay zekayı kullanmaya başlıyor, ancak yanıtlarının ne kadar acı verici olduğunun farkında değiller! Yapay zeka tarafından oluşturulan yazının, statik yazı için (tarih, gerçekler gibi) yaratıcı veya analitik yazıya kıyasla çok daha iyi olduğunu fark edeceksiniz. Bir konu ne kadar çok bilgiye sahipse, yapay zeka o kadar iyi yazıp işleyebilir.
4. Yanlış veriler: Bu, yapay zeka tarafından oluşturulan ürün açıklamalarında daha yaygındır, ancak blog yazılarında ve makalelerde de bulunabilir. Makineler çeşitli kaynaklardan veri topladıkları için bazen hata yaparlar. Bir makine bir şey bilmiyorsa ancak bir çıktı vermeye mahkumsa, kalıplara (doğru olmayan) dayalı olarak sayıları tahmin edecektir. Dolayısıyla, bir makale okuyorsanız ve gerçekler ile rakamlar arasında birkaç tutarsızlık fark ederseniz, az önce okuduklarınızın yapay zeka kullanılarak yazıldığından çok emin olabilirsiniz. Spam içerikle karşılaşırsanız, bunu Google'a bildirin . Başkasını açıkça yanlış olan bir şeyi okumak için zamanını harcamak zorunda kalmanın acısından kurtarın!
Bazı araştırmalar, mevcut GPT-3 tarafından oluşturulan içeriğin insan tarafından yazılan içerikten ayırt edilemeyeceğini iddia ediyor, ancak bir yapay zeka tarafından yazılan ve üniversite seviyesinin üzerinde görünen tutarlı uzun biçimli içerik görmedim. Oraya kesinlikle varacağız, ama henüz tam olarak orada değiliz.

Yöntem 5: Kaynakları ve Yazar Güvenilirliğini Doğrulayın


Bu, tek bir blog için biraz gereksiz görünebilir, ancak yine de bahsetmeye değer. Bir makale okuyorsanız ve alan adı, yayınlanan içerikle rastgele ilişkilendirilmiş gibi görünüyorsa, bu sizin ilk kırmızı işaretinizdir. Ancak daha da önemlisi, makalede kullanılan kaynakları (varsa) kontrol etmelisiniz. Bir yazar şüpheli web sitelerinden kaynaklar kullanıyorsa veya herhangi bir kaynağı olmadan bir şeyler beyan ediyorsa, bu yazar ya araştırmasını yapmıyordur ya da yapay zeka tarafından oluşturulmuş bir grup içeriği otomatikleştiriyor olabilir.

Ekstra Yöntem: Writer.com AI İçerik Dedektörü


Yapay zeka içeriğini tespit etmeye yönelik parametreler net olmasa da, Writing.com ücretsiz ve son derece basit bir yapay zeka yazma algılama aracı sunar. Metni URL ile kontrol edebilir veya taramaları çalıştırmak için yazıyı doğrudan araçlarına yapıştırabilirsiniz. Bununla iyi bir başarı elde ettim, ancak işaretli içeriği belirledikleri yöntemleri bulmakta zorlanıyorum.

Bir Diğeri: GPT-2 Çıkış Dedektörü


Ek bir kaynak , Hugging Face Output Detector'ı kullanmaktır . Bu hizmet, OpenAI tarafından yayınlanan GPT-2 Çıktı Veri Kümesine dayanmaktadır . Ekstra bir yöntem olarak dahil etmemin nedeni, bazı tahminleri çok doğru bulmamamdır. Genellikle cevaba göre iyi bir ipucu elde edebilirsiniz, ancak bazı tamamen robotik yapay zeka yazısını yapıştırdım ve bana bunun %99 gerçek olduğunu söyledi. Ayrıca bir insan tarafından yazılmış ve %99 yapay zeka olduğunu iddia eden ileri düzey bir akademik makaleyi de yapıştırdım. Her örnekte ne kadar çok metin varsa, tahmin doğruluğu olasılığı da o kadar artar. Ancak bazen bu gerçekten bir yazı tura atmaktır - bu nedenle tüm bu hizmetleri biraz tereddütle almayı unutmayın!

Diğer Çevrimiçi Tespit Yöntemleri


İçeriğinizin yapay zeka tarafından üretilip üretilmediğini kontrol edeceklerini iddia eden rastgele web siteleri bulurken dikkatli olun. Yapay zeka içeriği algılama araçları arıyorsanız, içeriği nasıl kontrol ettiklerini açıkladıklarından emin olun - çünkü "yapay zeka algılama" tek başına bir anlam ifade etmez!

Çözüm


Bir makalenin bir yapay zeka tarafından yazıp yazılmadığını söylemek kolay değil . Teknoloji, makine öğrenimi endüstrisinde ani bir patlama gibi görünen şeyin ardından ancak yakın zamanda kullanıma sunuldu. Rahatsız edici bir gerçek şu ki, yapay zeka her geçen gün çok daha iyiye gidiyor . Bununla birlikte, bir makalenin bir yapay zeka tarafından yazıp yazılmadığını sorguluyorsanız, yapabileceğiniz en iyi şey GLTR , Özgünlük kombinasyonunu kullanmaktır.ve kendi yargınız! Umarım bu yeni araçlar, şüphecilerin internetteki güvenilir içeriği filtrelemesine izin vererek web'e fayda sağlar. AI daha sofistike hale geldikçe ve insan ve makine tarafından oluşturulan içerik arasındaki çizgi giderek daha fazla bulanıklaştıkça, içeriğin ayırt edilemez hale geldiği noktaya ulaşmamız sadece an meselesi! Ama şimdilik - stres yapmayın. Henüz orada değiliz 😉



https://goldpenguin.org/blog/check-for-ai-content/


sizler için araştırdım yurt dışı kaynaklara ulaştım umarım işinizi görür