Ana içeriğe atla

Ders Detayı

Ders Tanımı

DersKoduYarıyılT+U SaatKrediAKTS
VERİ MADENCİLİĞİ VE BÜYÜK VERİ KULLANIMIEPDD1213141Bahar Dönemi2+236
Ders Programı
Ön Koşul Dersleri
Önerilen Seçmeli Dersler
Dersin DiliTürkçe
Dersin SeviyesiDoktora
Dersin TürüZorunlu
Dersin KoordinatörüProf.Dr. Gökhan SİLAHTAROĞLU
Dersi VerenlerDr.Öğr.Üye. İlker KÖSE
Dersin Yardımcıları
Dersin AmacıÖğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği modllerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir.
Dersin İçeriğiBu ders; Veri Madenciliğine Giriş ,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) ,Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) ,Birliktelik Analizi ,Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) ,Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) ,Regresyon ve Lojistik Regresyon ,Yapay sinir Ağları (çalışma prensibi, Hyperparameters) ,Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi,Proje Sunumları - Değerlendirme ; konularını içermektedir.
Dersin Öğrenme KazanımlarıÖğretim YöntemleriÖlçme Yöntemleri
1. Veri Tabanından veri ambarı üretebilecektir.
1.1. Veri Madenciliğini açıklar.
1.2. Veri Ambarını tanımlar.
1.3. Designs the Star Data Warehouse Model.
1.4. Ana tablolar birliği veri ambarı modelini tasarlar.
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir.
2.1. Veri Madenciliği Modellerini tanımlar.
3. Sınıflandırma modelini uygulayabilecektir
3.1. Denetimli öğrenmeyi tanımlar.
3.2. Sınıf kavramını belirler.
3.3. Karar ağacı algoritmalarını tanımlar.
4. Kümeleme modelini uygulayabilecektir.
4.1. Denetimsiz Öğrenmeyi tanımlar.
4.2. Kümeleme kavramını açıklar.
5. Bağlantı analizi modelini uygulayabilecektir.
5.1. Bağlantı analizi kurallarını yorumlar.
Öğretim Yöntemleri:
Ölçme Yöntemleri:

Ders Akışı

SıraKonularÖn Hazırlık
1Veri Madenciliğine Giriş
2Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar
3Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme)
4Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram)
5Birliktelik Analizi
6Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset)Veri setini gözden geçir
7Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager)
8Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) Veri setini gözden geçir
9Regresyon ve Lojistik Regresyon
10Yapay sinir Ağları (çalışma prensibi, Hyperparameters)
11Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer)
12Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN)
13Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi
14Proje Sunumları - Değerlendirme
Kaynak
1. Data Mining Introductory and Advanced Topics, Margaret H. Dunham, Prentice Hall. Knime Application: https://docs.knime.com/
1. Data Mining Concepts and Techniques , J. Han & M. Kamber, Morgan Kaufman. 2. Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results , Bernard Marr, Wiley, 2016 3. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy, Cathy O'Neil ,2017 4. Naked Statistics: Stripping the Dread from the Data, Charles Wheelan, 2013 5. Kavram ve Algoritmalarıyla Temel Veri Madenciliği, Gökhan Silahtaroğlu, Papatya Yayıncılık.

Dersin Program Yeterliliklerine Katkısı

Dersin Program Yeterliliklerine Katkısı
NoProgram Yeterliliği Katkı Düzeyi
12345
1
Hedef popülasyonun, uygun kaynak ve çalışma popülasyonlarının, yeterli maruziyetin, sonuçların ve ortak değişken değerlendirmelerinin belirlenmesi de dahil olmak üzere bu sorunun yanıtlanmasına yardımcı olacak bir epidemiyolojik araştırma tasarlar
X
2
Epidemiyoloji metodolojisinde kavramsal bir çerçeve geliştirir
3
Tasarım ve analiz aşamalarında karıştırıcılar ve bias gibi çalışmanın sonucunu etkileyen faktörleri ele alır
X
4
Bias ve değişkenlik içeren karmaşık mekanizmaların etkilerini yorumlar.
5
Uygun olan temel istatistiksel kavramları ve yöntemleri uygular
X
6
İstatistiksel verileri açıklar
X
7
Klinik araştırma yürütmek için bir plan geliştirir
8
Randomize tasarımlarda nedensel etkileri tahmin etmeye yönelik yöntemleri ve randomizasyona alternatif tasarımları değerlendirir
9
Eşitsizliğin ölçülme yollarının ve bu ölçümlerin verilerin yorumlanmasını nasıl etkilediğinin kritiğini yapar
X
10
Hastalık tarama yöntemlerini yorumlama becerisi geliştirir
11
Epidemiyoloji metodolojisine ilişkin olanlar da dahil olmak üzere araştırma önerilerinin yeterliliğini ve bilimsel değerini eleştirel bir şekilde değerlendirir.
12
İnsan hastalıklarının fizyolojisi ve patofizyolojisi hakkındaki bilgilerini epidemiyolojik çalışmalara uygular.
13
Belirli sağlık durumlarının nedenlerini araştırır
14
Hastalıkların gidişatını tahmin eder
X
15
Araştırma bulgularını daha geniş bakış açısıyla, politika bağlamında yorumlar
X
16
Halk sağlığı ve klinik sorunlara yönelik geçerli ve etkili protokoller tasarlamak için bir temel geliştirir.
X
17
Bulaşıcı ve bulaşıcı olmayan hastalıkların epidemiyolojisi hakkında temel bilgi geliştirir

Değerlendirme Sistemi

Katkı DüzeyiMutlak Değerlendirme
Ara Sınavın Başarıya Oranı 50
Genel Sınavın Başarıya Oranı 50
Toplam 100
AKTS / İşyükü Tablosu
EtkinlikSayıSüresi (Saat)Toplam İş Yükü (Saat)
Ders Saati14342
Rehberli Problem Çözme2510
Problem Çözümü / Ödev / Proje / Rapor Tanzimi10770
Okul Dışı Diğer Faaliyetler000
Proje Sunumu / Seminer2510
Proje Sunumu / Seminer3515
Kısa Sınav (QUİZ) ve Hazırlığı000
Ara Sınav ve Hazırlığı11010
Genel Sınav ve Hazırlığı11010
Performans Görevi, Bakım Planı000
Toplam İş Yükü (Saat)167
Dersin AKTS Kredisi = Toplam İş Yükü (Saat)/30*=(167/30)6
Dersin AKTS Kredisi: *30 saatlik çalışma 1 AKTS kredisi sayılmaktadır.

Dersin Detaylı Bilgileri

Ders Tanımı

DersKoduYarıyılT+U SaatKrediAKTS
VERİ MADENCİLİĞİ VE BÜYÜK VERİ KULLANIMIEPDD1213141Bahar Dönemi2+236
Ders Programı
Ön Koşul Dersleri
Önerilen Seçmeli Dersler
Dersin DiliTürkçe
Dersin SeviyesiDoktora
Dersin TürüZorunlu
Dersin KoordinatörüProf.Dr. Gökhan SİLAHTAROĞLU
Dersi VerenlerDr.Öğr.Üye. İlker KÖSE
Dersin Yardımcıları
Dersin AmacıÖğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği modllerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir.
Dersin İçeriğiBu ders; Veri Madenciliğine Giriş ,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) ,Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) ,Birliktelik Analizi ,Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) ,Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) ,Regresyon ve Lojistik Regresyon ,Yapay sinir Ağları (çalışma prensibi, Hyperparameters) ,Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi,Proje Sunumları - Değerlendirme ; konularını içermektedir.
Dersin Öğrenme KazanımlarıÖğretim YöntemleriÖlçme Yöntemleri
1. Veri Tabanından veri ambarı üretebilecektir.
1.1. Veri Madenciliğini açıklar.
1.2. Veri Ambarını tanımlar.
1.3. Designs the Star Data Warehouse Model.
1.4. Ana tablolar birliği veri ambarı modelini tasarlar.
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir.
2.1. Veri Madenciliği Modellerini tanımlar.
3. Sınıflandırma modelini uygulayabilecektir
3.1. Denetimli öğrenmeyi tanımlar.
3.2. Sınıf kavramını belirler.
3.3. Karar ağacı algoritmalarını tanımlar.
4. Kümeleme modelini uygulayabilecektir.
4.1. Denetimsiz Öğrenmeyi tanımlar.
4.2. Kümeleme kavramını açıklar.
5. Bağlantı analizi modelini uygulayabilecektir.
5.1. Bağlantı analizi kurallarını yorumlar.
Öğretim Yöntemleri:
Ölçme Yöntemleri:

Ders Akışı

SıraKonularÖn Hazırlık
1Veri Madenciliğine Giriş
2Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar
3Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme)
4Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram)
5Birliktelik Analizi
6Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset)Veri setini gözden geçir
7Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager)
8Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) Veri setini gözden geçir
9Regresyon ve Lojistik Regresyon
10Yapay sinir Ağları (çalışma prensibi, Hyperparameters)
11Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer)
12Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN)
13Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi
14Proje Sunumları - Değerlendirme
Kaynak
1. Data Mining Introductory and Advanced Topics, Margaret H. Dunham, Prentice Hall. Knime Application: https://docs.knime.com/
1. Data Mining Concepts and Techniques , J. Han & M. Kamber, Morgan Kaufman. 2. Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results , Bernard Marr, Wiley, 2016 3. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy, Cathy O'Neil ,2017 4. Naked Statistics: Stripping the Dread from the Data, Charles Wheelan, 2013 5. Kavram ve Algoritmalarıyla Temel Veri Madenciliği, Gökhan Silahtaroğlu, Papatya Yayıncılık.

Dersin Program Yeterliliklerine Katkısı

Dersin Program Yeterliliklerine Katkısı
NoProgram Yeterliliği Katkı Düzeyi
12345
1
Hedef popülasyonun, uygun kaynak ve çalışma popülasyonlarının, yeterli maruziyetin, sonuçların ve ortak değişken değerlendirmelerinin belirlenmesi de dahil olmak üzere bu sorunun yanıtlanmasına yardımcı olacak bir epidemiyolojik araştırma tasarlar
X
2
Epidemiyoloji metodolojisinde kavramsal bir çerçeve geliştirir
3
Tasarım ve analiz aşamalarında karıştırıcılar ve bias gibi çalışmanın sonucunu etkileyen faktörleri ele alır
X
4
Bias ve değişkenlik içeren karmaşık mekanizmaların etkilerini yorumlar.
5
Uygun olan temel istatistiksel kavramları ve yöntemleri uygular
X
6
İstatistiksel verileri açıklar
X
7
Klinik araştırma yürütmek için bir plan geliştirir
8
Randomize tasarımlarda nedensel etkileri tahmin etmeye yönelik yöntemleri ve randomizasyona alternatif tasarımları değerlendirir
9
Eşitsizliğin ölçülme yollarının ve bu ölçümlerin verilerin yorumlanmasını nasıl etkilediğinin kritiğini yapar
X
10
Hastalık tarama yöntemlerini yorumlama becerisi geliştirir
11
Epidemiyoloji metodolojisine ilişkin olanlar da dahil olmak üzere araştırma önerilerinin yeterliliğini ve bilimsel değerini eleştirel bir şekilde değerlendirir.
12
İnsan hastalıklarının fizyolojisi ve patofizyolojisi hakkındaki bilgilerini epidemiyolojik çalışmalara uygular.
13
Belirli sağlık durumlarının nedenlerini araştırır
14
Hastalıkların gidişatını tahmin eder
X
15
Araştırma bulgularını daha geniş bakış açısıyla, politika bağlamında yorumlar
X
16
Halk sağlığı ve klinik sorunlara yönelik geçerli ve etkili protokoller tasarlamak için bir temel geliştirir.
X
17
Bulaşıcı ve bulaşıcı olmayan hastalıkların epidemiyolojisi hakkında temel bilgi geliştirir

Değerlendirme Sistemi

Katkı DüzeyiMutlak Değerlendirme
Ara Sınavın Başarıya Oranı 50
Genel Sınavın Başarıya Oranı 50
Toplam 100

Sayısal Veriler

Öğrenci Başarı Durumu

Ekleme Tarihi: 03/02/2023 - 10:12Son Güncelleme Tarihi: 03/02/2023 - 10:43