Dil Modeli Üretimi ve İnsan Yazımı Metinlerin Karşılaştırmalı Çözümlemesi: Akademik Metinler Bağlamında Bir İnceleme

Koşaner, ÖZGÜN; Çimen, Beyza; Karacan, Pelin

Dil Modeli Üretimi ve İnsan Yazımı Metinlerin Karşılaştırmalı Çözümlemesi: Akademik Metinler Bağlamında Bir İnceleme

Atıf İçin Kopyala

Koşaner Ö., Çimen B., Karacan P.

Günce Filoloji Çalışmaları 1, Veli Uğur, Editör, Günce Yayınları, Muğla, ss.141-154, 2023

Yayın Türü: Kitapta Bölüm / Araştırma Kitabı
Basım Tarihi: 2023
Yayınevi: Günce Yayınları
Basıldığı Şehir: Muğla
Sayfa Sayıları: ss.141-154
Editörler: Veli Uğur, Editör
Dokuz Eylül Üniversitesi Adresli: Evet

Bu araştırma, insan yazarlar tarafından oluşturulan metinleri büyük dil modelleri tarafından oluşturulan metinlerden ayıran dilsel farklılıklara ışık tutmaya çalışmaktadır. Bu iki metin kategorisini birbirinden ayırabilecek yapısal, biçimsel ve anlamsal ayırtıları inceleyerek, yapay zekâ tarafından üretilen içeriğin akademik metinlerde kullanılmasının sonuçlarının daha derinlemesine anlaşılmasına katkıda bulunmayı amaçlıyoruz. Ayrıca, bu modellerin akademik metinlerde intihali riskini artırabileceğine odaklanarak, büyük dil modellerinin kullanımına ilişkin artan endişelerin arkasındaki nedenleri aydınlatmayı amaçlıyoruz.

Bu makalenin ilerleyen bölümlerinde hem insanlar hem de büyük dil modelleri tarafından metin oluşturmanın dilbilimsel benzerliklerini ve farklılıklarını inceleyeceğiz. Bu inceleme yoluyla, eğitimcilere ve ilgili kurumlara yapay zekâ tarafından üretilen içerikler ile insan yazarlar tarafından oluşturulan metinler arasındaki ayırt edici bazı özellikleri ortaya koymaya, benzerlikleri saptamaya yönelik yapılan çalışmalara ve geliştirilen yöntemlere ışık tutmaya çalışacağız.

Çalışmamızda insan yazarlar tarafından oluşturulmuş 30 metin ile yapay zekâ tarafından oluşturulmuş aynı sayıda metni inceleyeceğiz. Verileri incelerken, biçimsözdizimsel çözümleme alt başlığı altında, tümce uzunluğu, sözcük dağarcığının zenginliği ve sözcük çeşitliliği, sözcük türü etiketi dağılımı, kurucu uzunlukları ve türleri ölçütlerini temel alacağız.

This research aims to clarify the linguistic differences that distinguish texts created by human authors from texts created by large language models. By analysing the structural, stylistic and semantic features that can distinguish between these two categories of texts, we aim to contribute to a deeper understanding of the implications of the use of AI-generated content in academic texts. We also aim to elucidate the reasons behind the growing concerns about the use of large language models, focusing on the fact that these models potentially increase the risk of plagiarism in academic texts. In the following sections of this paper we will investigate the linguistic similarities and differences in text creation by both humans and large language models. Through this review, we will try to reveal some of the distinctive features between the content produced by artificial intelligence and the texts created by human authors, and to shed light on the studies and methods for detecting commonalities for educators and related institutions. In our study, we will analyse 30 texts written by human authors and the same number of texts generated by artificial intelligence. When analysing the data, we will consider sentence length, lexical richness and lexical diversity, lexical tag distribution, constituent lengths and types as the main criteria under the morpho-syntactic analysis subsection.