A new and efficient method for synthetic data generation with generative adversarial networks


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Dokuz Eylül Üniversitesi, Fen Bilimleri Enstitüsü, Elektrik-Elektronik Mühendisliği Ana Bilim Dalı, Türkiye

Tezin Onay Tarihi: 2023

Tezin Dili: İngilizce

Öğrenci: OKAN DÜZYEL

Danışman: MEHMET KUNTALP

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

Yapay zekâ modelleri, özellikle derin sinir ağları, eğitim esnasında yeterli sayıda veriye ihtiyaç duyarlar. Verilerin yetersiz olduğu durumlarda modelin eğitimi başarısız olur. Ayrıca sınıflar arası veri dengesizliği de sınıflandırıcı sistemin eğitiminde başarısızlığa yol açan önemli bir problemdir. Böyle durumlarda bu sınıflar için veri kümesindeki verileri arttırmamız gerekmektedir. Klasik veri arttırma yöntemleri elimizdeki verileri değiştirerek yapılır. Mevcut verilerin benzerleri oluşturulur, yeni veriler üretilmez. Veri kümesinin çok kısıtlı olduğu alanlarda bu çözüm işe yaramaz. Böyle durumlarda elimizdeki sınırlı verilerden yeni veriler üretmemiz gerekir. Çekişmeli Üretici Ağ (ÇÜA) kullanılarak sentetik yeni veriler üretmek mümkündür ve böylece oluşturulan derin öğrenme modelinin çalışması için yeterli eğitim verisi sağlanabilir. Bu tezde, MIT-BIH Arrhythmia veri tabanı üzerinde yeni bir ÇÜA yaklaşımı kullanılarak sentetik ECG verileri üretilmiştir. Özellikle az kayıt içeren veri sınıfları için sentetik veri üretilmesi amaçlanmıştır. Önerilen bu yeni yaklaşımda belli bir sınıfa ait verilerin öbek dağılımları baz alınmıştır. Çalışma sonucunda elde edilen sentetik veriler ile eksik veri kümeleri arttırılmıştır. Geliştirilen sistemlerin başarımları her birinde farklı bir eğitim verisinin kullanıldığı farklı deneylerle incelenmiştir. Önerilen yeni yaklaşımla veri artırımı sonrası elde edilen derin öğrenme başarısının klasik GAN tabanlı yönteme göre arttığı gözlemlenmiştir.