DİL MODELİ ÜRETİMİ VE İNSAN YAZIMI METİNLERİN KARŞILAŞTIRMALI ÇÖZÜMLEMESİ: AKADEMİK METİNLER BAĞLAMINDA BİR İNCELEME


Koşaner Ö.

Söylem Uluslararası Filoloji Sempozyumu, Aydın, Turkey, 6 - 08 October 2023, pp.1

  • Publication Type: Conference Paper / Summary Text
  • City: Aydın
  • Country: Turkey
  • Page Numbers: pp.1
  • Dokuz Eylül University Affiliated: Yes

Abstract

Son 10 yılda genellikle Yapay Zekâ alanında araştırma yapanların ilgi alanına giren Büyük Dil Modelleri (Large Language Models), OpenAI şirketinin kendi geliştirdiği ChatGPT dil modelini genel kullanıma açmasıyla  birlikte gündelik konuşmaların popüler konularından biri haline gelmiştir. Metin üretme yetenekleri neredeyse insana yakınsayan dil modelleri yanlış bilgilendirme, bilgi uydurma ve üniversitede öğrencilere verilen ödevlerde intihal gibi olumsuz sonuçları olabileceği gerekçesiyle tartışma konusu olmuş, yurt içi ve yurt dışında birçok üniversite ve özel şirket büyük dil modellerinin kullanımına kısıtlama getirmiştir. Ancak, büyük dil modellerinin ürettiği ve neredeyse insana özgü kusursuzluğa sahip basit metinlerin insan üretimi metinlerden nasıl ayrılacağı konusu henüz çözüme kavuşturulmamıştır. Özellikle yapay zekâ alanyazınında BDM ile üretilmiş metinleri otomatik olarak saptayan yazılımlar geliştirilmeye başlanmıştır. Ancak bunların başarım oranları hâlâ istenen düzeyde değildir. Bu doğrultuda bu çalışmanın amacı, insanların ürettiği metinlerle, BDM ile üretilen metinler arasındaki dilbilimsel farklılıkları ortaya koymaktır. Bu amacı gerçekleştirmek için ChatGPT 3.5’in en son veri aldığı tarih olan Eylül 2021’den sonra yazılmış 30 bilimsel makalenin başlıkları, anahtar sözcükleri ve özetteki sözcük sayıları ChatGPT dil modeline komut istemi olarak girilmiş ve ChatGPT’den bu komut istemine uygun özet yazması istenmiştir. Çalışmanın bir sonraki aşamasında ChatGPT tarafından üretilen özetler, bilimsel makaleleri yazan araştırmacıların özetleriyle karşılaştırılacak ve aralarındaki farklar belirlenecektir. Karşılaştırmada tümce sayısı ve tümce uzunlukları, sözcük dağarcığının genişliği ve çeşitliliği, sözcük türlerinin dağılımı, kurucu uzunlukları ve türleri, insan üretimi ve BDM üretimi metinlerin benzerlik dereceleri ölçütleri kullanılacaktır. Elde edilen bulgular doğrultusunda BDM ile üretilen metinlerin araştırmacıların yazdıkları özetlerden farkları ortaya konması ve özellikle üniversite öğrencilerinin ödevlerinden BDM kullanıp kullanmadıklarını belirlemeye yönelik ölçütler belirlenmesi beklenmektedir.