Automated Synonym Dictionary Generation Tool for Turkish (ASDICT)


AKTAŞ Ö., BİRANT Ç. C., Aksu B., ÇEBİ Y.

BILIG, sa.65, ss.47-68, 2013 (SSCI) identifier identifier identifier

  • Yayın Türü: Makale / Tam Makale
  • Cilt numarası: Sayı: 65
  • Basım Tarihi: 2013
  • Dergi Adı: BILIG
  • Derginin Tarandığı İndeksler: Social Sciences Citation Index (SSCI), Scopus, TR DİZİN (ULAKBİM)
  • Sayfa Sayıları: ss.47-68
  • Dokuz Eylül Üniversitesi Adresli: Evet

Özet

Bu makalede, gerçekleştirimi yapılan Türkçe için Otomatik Eşanlamlılar Sözlüğü Oluşturma Aracı (ASDICT) ve algoritmaların geliştirme süreçleri detaylı bir şekilde anlatılmıştır. ASDICT, Türk Dil Kurumu (TDK) tarafından yayımlanan Güncel Türkçe Sözlük veritabanı üzerinde uygulanarak bir eşanlamlılar veritabanı elde edilmiştir. Eşanlamlılar sözlüğü oluşturma süreci, dört ayrı işlem uygulanarak gerçekleştirilmiştir. Bu işlemlerin sonucunda kesin olarak belirlenmiş olan eşanlamlı kelimeler Kesin Eşanlamlı (Definite Synonym (Dn) ) olarak sınıflandırılmış ve Eşanlamlılar Listesi'ne (Synonym List (SLi)) kaydedilmiştir. Kesin Eşanlamlı olarak sınıflandırılama- yan bazı kelimeler, Belirsiz (Ambiguity) olarak sınıflandırıla- rak, daha güvenilir bir eşanlamlılar veritabanı oluşturabilmek amacıyla, denetimli yöntemlerle kontrol edilip belirlenmek üzere Belirsizlik Listesine (Ambiguity File (AF) ) kaydedilmiştir. İşlemlerin sonucunda, Kesin Eşanlamlılar Veritabanı (Definite Synonyms Database (DSDB)) olarak adlandırılan eşanlamlı kelimeleri içeren veritabanı oluşturulmuş ve Türk Dil Kuru- mu'nun resmi web sitesinde kullanıma açılmıştır (TDK 2009).
In this paper, an Automated Synonym Dictionary GenerationTool for Turkish (ASDICT) was briefly described and the development process of the algorithms was given in detail.By applying the ASDICT onto the data of ContemporaryTurkish Dictionary published by Turkish Linguistic Association (TDK: Türk Dil Kurumu), a synonym database was obtained. The synonym dictionary generation process was carriedout by applying four processes. As a result of these processes,the definite synonyms were classified as Definite Synonym(Dn) and put into the Synonym List (SLi). Some words, whichcould not be classified as Dn, were classified as Ambiguity andstored in a file called Ambiguity File (AF) to be checked out bysupervised methods to build a more reliable synonym database.The synonym database for Contemporary Turkish Dictionary, which is called "Definite Synonyms Database (DSDB)",was built by applying ASDICT, and it is currently availableon the official web site of TDK (TDK 2009)