Ana içeriğe atla

Ders Detayı

Ders Tanımı

DersKoduYarıyılT+U SaatKrediAKTS
VERİ MADENCİLİĞİ VE İŞ ZEKASI-Güz Dönemi3+035
Ders Programı
Ön Koşul Dersleri
Önerilen Seçmeli Dersler
Dersin DiliTürkçe
Dersin SeviyesiLisans
Dersin TürüZorunlu
Dersin KoordinatörüProf.Dr. Gökhan SİLAHTAROĞLU
Dersi VerenlerÖğr.Gör. Nada A. M. MISK, Prof.Dr. Gökhan SİLAHTAROĞLU
Dersin Yardımcıları
Dersin AmacıÖğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği mollerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir.
Dersin İçeriğiBu ders; Veri Madenciliğine Giriş,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar.,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme),Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram),Birliktelik Analizi (Alışveriş Sepeti Analizi),Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager),Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması),Regresyon ve Lojistik Regresyon,Yapay sinir Ağları (çalışma prensibi, Hyperparameters),Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL,Proje Sunumları - Değerlendirme; konularını içermektedir.
Dersin Öğrenme KazanımlarıÖğretim YöntemleriÖlçme Yöntemleri
1. Veri Tabanından veri ambarı üretebilecektir.16, 9A
1.1. Veri Madenciliğini açıklar.16A
1.2. Veri Ambarını tanımlar.16
1.3. Yıldız veri ambarı modelini tasarlar.
1.4. Ana tablolar birliği veri ambarı modelini tasarlar.6F
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir.10, 9A
2.1. Veri Madenciliği Modellerini tanımlar.16, 9A
2.2. Sınıflandırma Kavramını tanımlar.16, 9
2.3. Kümeleme kavramını tanımlar.16, 9
2.4. Bağlantı analizi kavramını tanımlar.16, 9
3. Sınıflandırma modelini uygulayabilecektir.14, 6, 9A, F
3.1. Denetimli öğrenmeyi tanımlar.16, 9F
3.2. Sınıf kavramını belirler.9A, F
3.3. İstatistiksel algoritmaları sıralar.16
3.4. Karar ağaçlarını uygular.16A, F
3.5. Karar ağacı algoritmalarını tanımlar.16F
3.6. Budama ve saflık değerlerini tanımlar.9
4. Kümeleme modelini uygulayabilecektir.14, 16, 9A, F
4.1. Denetimsiz Öğrenmeyi tanımlar.16, 9F
4.2. Kümeleme kavramını açıklar.16, 9
4.3. Kümeleme algoritmalarını sıralar.F
4.4. K-means algoritmasını uygular.14F
4.5. Genetik algoritmaları tanımlar.F
5. Bağlantı analizi modelini uygulayabilecektir.14, 16, 9A, F
5.1. Bağlantı analizi kurallarını yorumlar.
5.2. Kaldıraç kavramını açıklar.16, 9
5.3. İlişki analizi yöntemini uygular.14, 9
5.4 Bağlantı analizi ile kümelemeyi birleştirir.2
6. Veri madenciliği Algoritmalarını uygulayabilecektir.2F
6.1. Sınıflandırma algoritmalarını veriler üzerinde uygular.2F
6.2. Kümeleme algoritmalarını veriler üzerinde uygular.2F
6.3. Bağlantı analizi algoritmalarını veriler üzerinde uygular.2F
6.4. Veri madenciliği uygulama çıktılarını yorumlar.2F
Öğretim Yöntemleri:10: Tartışma Yöntemi, 14: Bireysel Çalışma Yöntemi, 16: Soru - Cevap Tekniği , 2: Proje Temelli Öğrenme Modeli, 6: Deneyimle Öğrenme Modeli, 9: Anlatım Yöntemi
Ölçme Yöntemleri:A: Klasik Yazılı Sınav, F: Proje Görevi

Ders Akışı

SıraKonularÖn Hazırlık
1Veri Madenciliğine Giriş
2Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar.
3Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme)Veri İşlemleri Analizi Uygulama
4Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram)
5Birliktelik Analizi (Alışveriş Sepeti Analizi)
6Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS)Uygulamalı Veri Analizi
7Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager)
8Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması)
9Regresyon ve Lojistik Regresyon
10Yapay sinir Ağları (çalışma prensibi, Hyperparameters)
11Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer)
12Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN)
13Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL
14Proje Sunumları - Değerlendirme
Kaynak
1. Veri madenciliği kavram ve algoritmaları, Gökhan Silahtaroğlu, Papatya Yayıncılık. Knime Uygulama: https://docs.knime.com/
1. Çıplak İstatistik, Charles Wheelan 2. Araştırma Nasıl Tasarlanır Ve Raporlaştırılır, Andy Field ve Graham Hole 3. Master Algoritma 4. Homo İnformatiks: Bilişim Matematik ve Mantığın Kesişen Dünyaları 5. Matematiksel İmha Silahları: Büyük Veri, Eşitsizliği Nasıl Artırıp Demokrasiyi Tehdit Ediyor?, Cathy ONeil ve Akın Emre Pilgir 6. Hayatımızdaki Algoritmalar: Günlük Kararların Bilgisayar Bilimi 7. Yaşam 3.0: Yapay Zeka Çağında İnsan Olmak 8. Büyük Veri İş Başında: 45 Yıldız Şirket Büyük Veri'yi Nasıl Kullandı?: 45 Yıldız Şirket Büyük Veriyi Nasıl Kullandı?

Dersin Program Yeterliliklerine Katkısı

Dersin Program Yeterliliklerine Katkısı
NoProgram Yeterliliği Katkı Düzeyi
12345
1
Bilişim ve yönetim alanında teorik bilgileri tanımlar.
X
2
Bilişim ve yönetim alanında gerekli matematiksel ve istatistiki yöntemleri anlatır.
X
3
Bilişim ve yönetim alanında gerekli en az bir bilgisayar programı kullanır.
X
4
Bilişim ve yönetim alanında gerekli olan mesleki yabancı dil yeterliliğini gösterir.
5
Bilişim projeleri hazırlar ve takım çalışmalarını yönetir.
6
Mesleki alanda yaşam boyu öğrenmenin gerekliliği bilinciyle bilim ve teknolojideki gelişmeleri izleyerek kendini sürekli yenileyip edindiği bilgi ve becerileri eleştirel olarak değerlendirir.
X
7
Bilişim ve yönetim alanında teorik ve uygulamaya yönelik bilgileri kullanır
X
8
En az A1 düzeyinde bir yabancı dili kullanarak güncel teknolojileri takip eder, sözlü / yazılı iletişim kurar.
9
Örgüt / kurumsal, iş ve toplumsal etik değerlerini benimser ve kullanır.
10
Topluma hizmet duyarlılığı çerçevesinde, sosyal sorumluluk ilkelerini benimser ve gerektiğinde inisiyatif alır.
11
Disiplinler arası çalışmalar yürütebilmek için farklı disiplinlerde (ekonomi, finans, sosyoloji, hukuk, işletme) temel bilgileri ve verileri analiz ederek alanında kullanır.
X
12
Masaüstü, mobil, web gibi farklı platform yazılımlarını tek başına ve/veya bir ekip içerisinde yazar.

Değerlendirme Sistemi

Katkı DüzeyiMutlak Değerlendirme
Ara Sınavın Başarıya Oranı 40
Genel Sınavın Başarıya Oranı 60
Toplam 100
AKTS / İşyükü Tablosu
EtkinlikSayıSüresi (Saat)Toplam İş Yükü (Saat)
Ders Saati14342
Rehberli Problem Çözme21020
Problem Çözümü / Ödev / Proje / Rapor Tanzimi12224
Okul Dışı Diğer Faaliyetler2714
Proje Sunumu / Seminer313
Kısa Sınav (QUİZ) ve Hazırlığı144
Ara Sınav ve Hazırlığı11515
Genel Sınav ve Hazırlığı12020
Performans Görevi, Bakım Planı000
Toplam İş Yükü (Saat)142
Dersin AKTS Kredisi = Toplam İş Yükü (Saat)/30*=(142/30)5
Dersin AKTS Kredisi: *30 saatlik çalışma 1 AKTS kredisi sayılmaktadır.

Dersin Detaylı Bilgileri

Ders Tanımı

DersKoduYarıyılT+U SaatKrediAKTS
VERİ MADENCİLİĞİ VE İŞ ZEKASI-Güz Dönemi3+035
Ders Programı
Ön Koşul Dersleri
Önerilen Seçmeli Dersler
Dersin DiliTürkçe
Dersin SeviyesiLisans
Dersin TürüZorunlu
Dersin KoordinatörüProf.Dr. Gökhan SİLAHTAROĞLU
Dersi VerenlerÖğr.Gör. Nada A. M. MISK, Prof.Dr. Gökhan SİLAHTAROĞLU
Dersin Yardımcıları
Dersin AmacıÖğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği mollerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir.
Dersin İçeriğiBu ders; Veri Madenciliğine Giriş,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar.,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme),Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram),Birliktelik Analizi (Alışveriş Sepeti Analizi),Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager),Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması),Regresyon ve Lojistik Regresyon,Yapay sinir Ağları (çalışma prensibi, Hyperparameters),Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL,Proje Sunumları - Değerlendirme; konularını içermektedir.
Dersin Öğrenme KazanımlarıÖğretim YöntemleriÖlçme Yöntemleri
1. Veri Tabanından veri ambarı üretebilecektir.16, 9A
1.1. Veri Madenciliğini açıklar.16A
1.2. Veri Ambarını tanımlar.16
1.3. Yıldız veri ambarı modelini tasarlar.
1.4. Ana tablolar birliği veri ambarı modelini tasarlar.6F
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir.10, 9A
2.1. Veri Madenciliği Modellerini tanımlar.16, 9A
2.2. Sınıflandırma Kavramını tanımlar.16, 9
2.3. Kümeleme kavramını tanımlar.16, 9
2.4. Bağlantı analizi kavramını tanımlar.16, 9
3. Sınıflandırma modelini uygulayabilecektir.14, 6, 9A, F
3.1. Denetimli öğrenmeyi tanımlar.16, 9F
3.2. Sınıf kavramını belirler.9A, F
3.3. İstatistiksel algoritmaları sıralar.16
3.4. Karar ağaçlarını uygular.16A, F
3.5. Karar ağacı algoritmalarını tanımlar.16F
3.6. Budama ve saflık değerlerini tanımlar.9
4. Kümeleme modelini uygulayabilecektir.14, 16, 9A, F
4.1. Denetimsiz Öğrenmeyi tanımlar.16, 9F
4.2. Kümeleme kavramını açıklar.16, 9
4.3. Kümeleme algoritmalarını sıralar.F
4.4. K-means algoritmasını uygular.14F
4.5. Genetik algoritmaları tanımlar.F
5. Bağlantı analizi modelini uygulayabilecektir.14, 16, 9A, F
5.1. Bağlantı analizi kurallarını yorumlar.
5.2. Kaldıraç kavramını açıklar.16, 9
5.3. İlişki analizi yöntemini uygular.14, 9
5.4 Bağlantı analizi ile kümelemeyi birleştirir.2
6. Veri madenciliği Algoritmalarını uygulayabilecektir.2F
6.1. Sınıflandırma algoritmalarını veriler üzerinde uygular.2F
6.2. Kümeleme algoritmalarını veriler üzerinde uygular.2F
6.3. Bağlantı analizi algoritmalarını veriler üzerinde uygular.2F
6.4. Veri madenciliği uygulama çıktılarını yorumlar.2F
Öğretim Yöntemleri:10: Tartışma Yöntemi, 14: Bireysel Çalışma Yöntemi, 16: Soru - Cevap Tekniği , 2: Proje Temelli Öğrenme Modeli, 6: Deneyimle Öğrenme Modeli, 9: Anlatım Yöntemi
Ölçme Yöntemleri:A: Klasik Yazılı Sınav, F: Proje Görevi

Ders Akışı

SıraKonularÖn Hazırlık
1Veri Madenciliğine Giriş
2Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar.
3Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme)Veri İşlemleri Analizi Uygulama
4Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram)
5Birliktelik Analizi (Alışveriş Sepeti Analizi)
6Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS)Uygulamalı Veri Analizi
7Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager)
8Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması)
9Regresyon ve Lojistik Regresyon
10Yapay sinir Ağları (çalışma prensibi, Hyperparameters)
11Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer)
12Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN)
13Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL
14Proje Sunumları - Değerlendirme
Kaynak
1. Veri madenciliği kavram ve algoritmaları, Gökhan Silahtaroğlu, Papatya Yayıncılık. Knime Uygulama: https://docs.knime.com/
1. Çıplak İstatistik, Charles Wheelan 2. Araştırma Nasıl Tasarlanır Ve Raporlaştırılır, Andy Field ve Graham Hole 3. Master Algoritma 4. Homo İnformatiks: Bilişim Matematik ve Mantığın Kesişen Dünyaları 5. Matematiksel İmha Silahları: Büyük Veri, Eşitsizliği Nasıl Artırıp Demokrasiyi Tehdit Ediyor?, Cathy ONeil ve Akın Emre Pilgir 6. Hayatımızdaki Algoritmalar: Günlük Kararların Bilgisayar Bilimi 7. Yaşam 3.0: Yapay Zeka Çağında İnsan Olmak 8. Büyük Veri İş Başında: 45 Yıldız Şirket Büyük Veri'yi Nasıl Kullandı?: 45 Yıldız Şirket Büyük Veriyi Nasıl Kullandı?

Dersin Program Yeterliliklerine Katkısı

Dersin Program Yeterliliklerine Katkısı
NoProgram Yeterliliği Katkı Düzeyi
12345
1
Bilişim ve yönetim alanında teorik bilgileri tanımlar.
X
2
Bilişim ve yönetim alanında gerekli matematiksel ve istatistiki yöntemleri anlatır.
X
3
Bilişim ve yönetim alanında gerekli en az bir bilgisayar programı kullanır.
X
4
Bilişim ve yönetim alanında gerekli olan mesleki yabancı dil yeterliliğini gösterir.
5
Bilişim projeleri hazırlar ve takım çalışmalarını yönetir.
6
Mesleki alanda yaşam boyu öğrenmenin gerekliliği bilinciyle bilim ve teknolojideki gelişmeleri izleyerek kendini sürekli yenileyip edindiği bilgi ve becerileri eleştirel olarak değerlendirir.
X
7
Bilişim ve yönetim alanında teorik ve uygulamaya yönelik bilgileri kullanır
X
8
En az A1 düzeyinde bir yabancı dili kullanarak güncel teknolojileri takip eder, sözlü / yazılı iletişim kurar.
9
Örgüt / kurumsal, iş ve toplumsal etik değerlerini benimser ve kullanır.
10
Topluma hizmet duyarlılığı çerçevesinde, sosyal sorumluluk ilkelerini benimser ve gerektiğinde inisiyatif alır.
11
Disiplinler arası çalışmalar yürütebilmek için farklı disiplinlerde (ekonomi, finans, sosyoloji, hukuk, işletme) temel bilgileri ve verileri analiz ederek alanında kullanır.
X
12
Masaüstü, mobil, web gibi farklı platform yazılımlarını tek başına ve/veya bir ekip içerisinde yazar.

Değerlendirme Sistemi

Katkı DüzeyiMutlak Değerlendirme
Ara Sınavın Başarıya Oranı 40
Genel Sınavın Başarıya Oranı 60
Toplam 100

Sayısal Veriler

Öğrenci Başarı Durumu

Ekleme Tarihi: 06/07/2022 - 15:07Son Güncelleme Tarihi: 06/07/2022 - 15:09