Futbol Verilerinin Karar Ağaçları ve Lojistik Regresyon Yöntemleri ile İncelenmesi


Topcu D., Vupa Çilengiroğlu Ö.

Spor Bilimleri Araştırmaları Dergisi, cilt.6, sa.2, ss.491-503, 2021 (Hakemli Dergi)

  • Yayın Türü: Makale / Tam Makale
  • Cilt numarası: 6 Sayı: 2
  • Basım Tarihi: 2021
  • Doi Numarası: 10.25307/jssr.978449
  • Dergi Adı: Spor Bilimleri Araştırmaları Dergisi
  • Derginin Tarandığı İndeksler: TR DİZİN (ULAKBİM), Sobiad Atıf Dizini
  • Sayfa Sayıları: ss.491-503
  • Dokuz Eylül Üniversitesi Adresli: Evet

Özet

Futbol dünyada ve Türkiye'de en çok takip edilen sporlardan biridir. Futbolun bu yaygınlık durumu, bilgi teknolojilerinde kullanılmakta ve gelişen veri bilimi ile birlikte maç istatistikleri kolay bir biçimde saptanabilmektedir. Futbol müsabakalarında en çok ilgilenilen konu ise maç sonucudur. Maç sonucunu etkileyen birçok farklı kriter (atılan gol sayısı, takımın aldığı kart sayısı, hava durumu, deplasmanda oynamak vb.) bulunmaktadır. Bu çalışmada Türkiye Futbol Federasyonu Süper Ligi 2019- 2020 ve 2020-2021 sezonlarında oynanan karşılaşmalardan elde edilen veriler kullanılmıştır. Takımların kazanma ve kaybetme durumları sınıflandırma ve karar ağacı yöntemleri ile modellenmesi ise çalışmanın temel amacını oluşturmaktadır. Oynanan maçlarda ev sahibi ve rakip takımın aldığı kırmızı veya sarı kartlar, takımlarda yer alan yabancı oyuncu sayıları ve atılan gol sayıları kategorik bir biçime getirilerek bağımsız değişkenler olarak belirlenmiştir. Bu değişkenlere bağlı olarak ev sahibi takımın kazanma veya kaybetme durumu Lojistik Regresyon ve Karar Ağacı (CART, QUEST ve CHAID) algoritmaları kullanılarak modellenmiştir. Çalışma kapsamında altı ayrı model oluşturulmuştur. Oluşturulan modellerin doğruluk yüzdeleri, duyarlılıkları, seçicilikleri ve F-skor değerleri karşılaştırılarak en iyi modelin karar ağaçlarından %67.6’lık doğruluk yüzdesi ile CART algoritması olduğuna karar verilmiştir. Bu modelde yer alan rakip kırmızı kart durumu ile ofansif ve defansif güçlerin takımın kazanmasında ya da kaybetmesinde önemli olduğu tespit edilmiştir. Ayrıca futbol verilerinin modellenmesinde makine öğrenim algoritmalarının kullanılabileceği de gösterilmiştir.