DEVELOPING A NEW APPROACH IN NATURAL LANGUAGE UNDERSTANDING TO DETECT DEFECTIVE EXPRESSIONS FOR TURKISH


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Dokuz Eylül Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Bölümü, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: İngilizce

Öğrenci: ATİLLA SUNCAK

Danışman: Özlem Aktaş

Özet:

Anlatım bozukluğu, Türkçe cümlelerdeki anlamsal ve biçimsel belirsizlikleri ifade eden dil bilgisel bir terimdir. Genelde cümledeki özne, yüklem, nesne gibi ögeleri gereksiz kullanımından veya hiç kullanılmamasından ya da eklerin yanlış kullanımından kaynaklanırlar. Literatürdeki çeşitli çalışmalar incelendiğinde, bu konu ile alakalı çoğunlukla dilbilimcilerin gerçekleştirdiği öğrenci anketleri ve kompozisyon analizleri ya da araştırmacıların yaptığı manuel analizler ortaya çıkmaktadır. Konu ile alakalı doğal dil işleme çalışmalarının olmaması, bizi bu konuyu bilgisayar teknolojileri kullanarak analiz etmeye  yöneltmiştir. Ancak, Türkçe gibi dil bilgisel anlamda zorlu diller, özellikle anlamsal problemlerde kural tabanlı ve dile özgü çözümler gerektirir. Kural tabanlı sistemlerin ise işlem sırasındaki etkinliği, geliştirme sırasındaki zaman tüketimi ve dildeki değişime karşı adaptasyon problemleri gibi büyük engelleri mevcuttur. Makine öğrenmesi modelleri,  son yıllarda büyük gelişmeler göstermiştir, bu gelişmeler ise doğal dil işleme uygulamalarında eşi görülmemiş bir performans artışı sağlamıştır. Bu tezde, anlatım bozukluklarının tespitinde derin öğrenme modellerinden LSTM ve CNN; makine öğrenmesi sınıflandırıcılarından da KNN, SVM ve RF modelleri önerilmiştir.

Deneysel çalışmalar, derin öğrenme yaklaşımlarının, anlatım bozukluğu tespitinde makine öğrenmesi sınıflandırıcılarına göre daha ön plana çıktığını göstermektedir. Ayrıca bu çalışma, veri seti artırıldığında ve daha uygun hale getirildiği takdirde, uzun dönem bağımlılıklarının da öğrenme kabiliyetine sahip olduğundan LSTM mimarisinin daha iyi sonuçlar verebileceğini yansıtmaktadır. Tezin, bu alanda yapılan orijinal bir çalışma olması, Türkçe doğal dil işlemeye büyük bir katkı sağlayacak ve alanda çalışma yapan diğer araştırmacılara da iyi bir kaynak olacağı düşünülmektedir.