Automated Antonym Dictionary Generation Tool For Turkish AADICT


Birant Ç. C., Aktaş Ö., Koşaner Ö., Aksu B., Çebi Y.

Uluslararası Türkçe Eğitimi ve Öğretimi Dergisi: Kuram ve Uygulama, cilt.1, sa.2, ss.1-17, 2016 (Hakemli Dergi)

Özet

Bu çalışmada, Türkçe için geliştirilen Otomatik Zıt Anlamlılar Sözlüğü Oluşturma Aracı (AADICT) kısaca açıklanmış ve algoritmaların gelişim süreci ayrıntılı olarak anlatılmıştır. Türk Dil Kurumu (TDK: Türk Dil Kurumu) tarafından yayınlanan Güncel Türkçe Sözlük verilerine AADICT uygulanarak zıt ve karşıt kelime veritabanı elde edilmiştir. Üç seviyede işlemler uygulanarak zıt anlamlılar sözlüğü oluşturma süreci gerçekleştirilmiştir. Bu işlemlerin bir sonucu olarak belirlenen zıt anlamlı sözcükler Kesin Zıt Anlamlı (Definite Antonym (Dn)) olarak sınıflandırılmış ve Zıt Anlamlı Sözcükler Listesi ’ne (Antonym List (ALi)) konulmuştur. Kesin Zıt Anlamlı (Dn) olarak sınıflandırılamayan bazı sözcükler Belirsiz Dosya (Ambiguity File (AF)) olarak adlandırılan ve ileride daha güvenilir zıt anlamlılar veritabanını oluşturabilmek amacıyla denetimli yöntemlerle kontrol edilebilecekleri bir dosyada saklanmıştır. Kesin Zıt Anlamlılar Veri tabanı (Definite Antonyms Database (DADB)) olarak adlandırılan zıt anlamlılar listesi, Güncel Türkçe Sözlük üzerine AADICT uygulanarak inşa edilmiş ve TDK resmi internet sitesinde "Türkçe Karşıt Anlamlılar Sözlüğü" olarak yayınlanmıştır. Geliştirilen bu sözlük, okullarda herhangi bir seviyedeki öğrencilere ve yabancı dil olarak Türkçe öğrenen öğrencilere Türkçeyi doğru şekilde öğrenmelerine yardımcı olabilecektir. Ayrıca, bilişimsel dilbilim alanında yapılan çalışmalarda da kullanılabilecektir.

In   this   paper,   an   Automated   Antonym   Dictionary   Generation   Tool   for Turkish (AADICT)  is  briefly  described  and  the  development  process  of  the algorithms  is  given  in details.By applying the AADICT on to the data of Contemporary Turkish Dictionary, which is published by Turkish Linguistic Association (TDK: Türk Dil Kurumu), antonyms and opposite words  database was  obtained.  The  antonym  dictionary  generation  process  was  carried out through three processes. As a result of these processes, the definite antonyms were classified as Definite  Antonym  (Dn)and  put  into  the Antonym  List  (ALi). Some  words,  which  could  not  be classified as Dn,were classified as “Ambiguity” and stored in afile called Ambiguity File (AF)to be checked out by supervised methods to build more reliable antonym database.The  antonyms database,  which  is  called “Definite Antonyms Database (DADB)”,  for Contemporary   Turkish   Dictionary   was   built   by   applying   AADICT, has been   currently published as “Turkish Antonyms Dictionary” on the official web site of TDK. This dictionary will help the students that get as lesson in the  school at any level or learn Turkish as a foreign language.Also, it may be used in the researches of computational linguistics field.