Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Dokuz Eylül Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Ana Bilim Dalı, Türkiye
Tezin Onay Tarihi: 2021
Tezin Dili: İngilizce
Öğrenci: TUĞÇE PAKSOY
Danışman: İDİL YAVUZ
Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu
Özet:Sağkalım analizi birçok alanda kullanılan istatistiksel bir yaklaşım yöntemidir. Bu yöntemi diğer analiz yöntemlerinden ayıran en önemli özellik sansürlü gözlemlerin mevcut olduğu durumlarda kullanılabilmesidir. Literatürde sağkalım analizi geleneksel sağkalım analizi methodları ve makine öğrenmesi tabanlı sağkalım analizi methodları olarak ikiye ayrılmıştır. Artan veri ve değişken sayısı, sansürlü gözlemlerin varlığı ve geleneksel yöntemlerin bazı varsayımlar gerektirmesi durumları sağkalım verilerinin geleneksel yöntemler ile analiz edilmesini zorlaştırmaktadır. Bu durumla baş edebilmek için sağkalım verilerine özgü makine öğrenmesi yöntemleri kullanılmaktadır. Bu tezde Kaplan Meier, Log rank testi ve Cox regresyon gibi geleneksel sağkalım analizi yöntemleri tanıtılmakta ve makine öğrenme tabanlı sağkalım ağaçları ve rassal sağkalım ormanları çalışılmıştır. Uygulamada rassal sağkalım ormanları ve Cox regresyon modellerinin uyum istatistikleri, farklı sansür oranlarının test edildiği simülasyon sonucu elde edilen veriler ve gerçek veriler kullanılarak elde edilmiştir. Gerektiğinde sağkalım eğrileri ve değişken önem metrikleri için uygun grafiksel gösterimler verilmiştir. Bu tezde verilen örneklerde gösterildiği gibi, geleneksel yaklaşımlar, varsayımlar karşılandığında ve istatistiksel güç yüksek olduğunda avantajlıdır, ancak sansürleme yüksek olduğunda ve varsayımlar karşılanmadığında makine öğrenimi tabanlı yöntemler daha iyi çalışır.