Veri Madenciliği (Bahar-23)

ENM424

Kodu: “ENM424” Google Class: orlap6f

Ders notları: kitap

Amaç

Veri Madenciliği veri tabanlarından bilgi keşfi süreci olarak tanımlanır. Veri madenciliği teknikleri sayesinde büyük veri tabanlarından gizli olan anlamlı bilgiler çıkarılır. Bu ders veri madenciliğinin istatiksel, makine öğrenmesi ve veri tabanı yönünden temellerini içermektedir. Derste veri madenciliğinin temel kavramları gösterildikten sonra veri hazırlama, sınıflandırma, kümeleme, birliktelik analizleri gibi veri madenciliği uygulamaları anlatılacaktır. Ayrıca derste veri madenciliğinde veriden anlamlı bilgi keşfedilme sürecinden bahsedilecek ve veri madenciliğinde kullanılan istatistiksel metotlara yer verilecektir. Günümüzün trend konuları olan makine öğrenmesi ve yapay sinir ağları ile ilgili bilgiler de ders kapsamında anlatılacaktır.

  1. Veri madenciliğinin temel kavramlarını, amaçlarını ve tekniklerini tanıtmak ve kullanımını yaygınlaştırılması
  2. Geniş ölçekli veri tabanlarında analiz yeteneğinin kazandırılması
  3. Veri madenciliği uygulamaları ve popüler konuları hakkında bilgi ve yeterlilik kazandırılması
  4. Veri madenciliği uygulamaları geliştirmeye yönelik yeterlilik kazandırılması
  5. Veriyi anlama, yorumlama, analiz etme ve görselleştirme gibi yeteneklerin kazandırılması

Ana Kitap

  1. Tan, Pang, et al., Introduction to Data Mining, Pearson, 2018, link.

Yardımcı Kaynaklar


  1. Han, Jiawei, et al., Data Mining: Concepts and Techniques, Morgan Kaufmann link.
  2. Kantardzic, Mehmed, Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-IEEE Press, 2019 link.
  3. Leskovec, Jure, et al., Mining of Massive Datasets, Cambridge Uni Press, 2014 link.
  4. Sumathi, S., Introduction to Data Mining and Its Applications, Springer, 2006 link.
  5. Laura Igual et al., Introduction to Data Science, Springer, 2017 link.

Program

Derste öğrenilen algoritma ve teknikler Python programlama dili ile geliştirilecek kodlar sayesinde uygulanacaktır. Python programlama dilinde özellikle, Numpy, scikit-learn, Scipy, pandas, matplotlib gibi kütüphanelerin bilinmesi önerilir. Python ile geliştirilen kodlar ile birlikte Orange aracı da kullanılarak veri madenciliği teknikleri uygulanacaktır. Bu dersi programlama bilgisi olmayanların tercih etmesi önerilmemektedir.

Bağlantılar

Bu dersin diğer üniversitelerdeki bağlantıları;

Yayınlar

Veri madenciliği ile alakalı takip edilmesi gereken bazı yayınlar aşağıda listelenmiştir.