Ders Detayı
Ders Tanımı
Ders | Kodu | Yarıyıl | T+U Saat | Kredi | AKTS |
---|---|---|---|---|---|
VERİ MADENCİLİĞİ VE İŞ ZEKASI | - | Güz Dönemi | 3+0 | 3 | 5 |
Ders Programı |
Ön Koşul Dersleri | |
Önerilen Seçmeli Dersler |
Dersin Dili | Türkçe |
Dersin Seviyesi | Lisans |
Dersin Türü | Zorunlu |
Dersin Koordinatörü | Prof.Dr. Gökhan SİLAHTAROĞLU |
Dersi Verenler | Prof.Dr. Gökhan SİLAHTAROĞLU |
Dersin Yardımcıları | |
Dersin Amacı | Öğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği mollerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir. |
Dersin İçeriği | Bu ders; Veri Madenciliğine Giriş,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar.,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme),Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram),Birliktelik Analizi (Alışveriş Sepeti Analizi),Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager),Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması),Regresyon ve Lojistik Regresyon,Yapay sinir Ağları (çalışma prensibi, Hyperparameters),Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL,Proje Sunumları - Değerlendirme; konularını içermektedir. |
Dersin Öğrenme Kazanımları | Öğretim Yöntemleri | Ölçme Yöntemleri |
1. Veri Tabanından veri ambarı üretebilecektir. | 16, 9 | A |
1.1. Veri Madenciliğini açıklar. | 16 | A |
1.2. Veri Ambarını tanımlar. | 16 | |
1.3. Yıldız veri ambarı modelini tasarlar. | ||
1.4. Ana tablolar birliği veri ambarı modelini tasarlar. | 6 | F |
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir. | 10, 9 | A |
2.1. Veri Madenciliği Modellerini tanımlar. | 16, 9 | A |
2.2. Sınıflandırma Kavramını tanımlar. | 16, 9 | |
2.3. Kümeleme kavramını tanımlar. | 16, 9 | |
2.4. Bağlantı analizi kavramını tanımlar. | 16, 9 | |
3. Sınıflandırma modelini uygulayabilecektir. | 14, 6, 9 | A, F |
3.1. Denetimli öğrenmeyi tanımlar. | 16, 9 | F |
3.2. Sınıf kavramını belirler. | 9 | A, F |
3.3. İstatistiksel algoritmaları sıralar. | 16 | |
3.4. Karar ağaçlarını uygular. | 16 | A, F |
3.5. Karar ağacı algoritmalarını tanımlar. | 16 | F |
3.6. Budama ve saflık değerlerini tanımlar. | 9 | |
4. Kümeleme modelini uygulayabilecektir. | 14, 16, 9 | A, F |
4.1. Denetimsiz Öğrenmeyi tanımlar. | 16, 9 | F |
4.2. Kümeleme kavramını açıklar. | 16, 9 | |
4.3. Kümeleme algoritmalarını sıralar. | F | |
4.4. K-means algoritmasını uygular. | 14 | F |
4.5. Genetik algoritmaları tanımlar. | F | |
5. Bağlantı analizi modelini uygulayabilecektir. | 14, 16, 9 | A, F |
5.1. Bağlantı analizi kurallarını yorumlar. | ||
5.2. Kaldıraç kavramını açıklar. | 16, 9 | |
5.3. İlişki analizi yöntemini uygular. | 14, 9 | |
5.4 Bağlantı analizi ile kümelemeyi birleştirir. | 2 | |
6. Veri madenciliği Algoritmalarını uygulayabilecektir. | 2 | F |
6.1. Sınıflandırma algoritmalarını veriler üzerinde uygular. | 2 | F |
6.2. Kümeleme algoritmalarını veriler üzerinde uygular. | 2 | F |
6.3. Bağlantı analizi algoritmalarını veriler üzerinde uygular. | 2 | F |
6.4. Veri madenciliği uygulama çıktılarını yorumlar. | 2 | F |
Öğretim Yöntemleri: | 10: Tartışma Yöntemi, 14: Bireysel Çalışma Yöntemi, 16: Soru - Cevap Tekniği , 2: Proje Temelli Öğrenme Modeli, 6: Deneyimle Öğrenme Modeli, 9: Anlatım Yöntemi |
Ölçme Yöntemleri: | A: Klasik Yazılı Sınav, F: Proje Görevi |
Ders Akışı
Sıra | Konular | Ön Hazırlık |
---|---|---|
1 | Veri Madenciliğine Giriş | |
2 | Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar. | |
3 | Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) | Veri İşlemleri Analizi Uygulama |
4 | Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) | |
5 | Birliktelik Analizi (Alışveriş Sepeti Analizi) | |
6 | Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS) | Uygulamalı Veri Analizi |
7 | Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) | |
8 | Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması) | |
9 | Regresyon ve Lojistik Regresyon | |
10 | Yapay sinir Ağları (çalışma prensibi, Hyperparameters) | |
11 | Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer) | |
12 | Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN) | |
13 | Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL | |
14 | Proje Sunumları - Değerlendirme |
Kaynak |
1. Veri madenciliği kavram ve algoritmaları, Gökhan Silahtaroğlu, Papatya Yayıncılık. Knime Uygulama: https://docs.knime.com/ |
1. Çıplak İstatistik, Charles Wheelan 2. Araştırma Nasıl Tasarlanır Ve Raporlaştırılır, Andy Field ve Graham Hole 3. Master Algoritma 4. Homo İnformatiks: Bilişim Matematik ve Mantığın Kesişen Dünyaları 5. Matematiksel İmha Silahları: Büyük Veri, Eşitsizliği Nasıl Artırıp Demokrasiyi Tehdit Ediyor?, Cathy ONeil ve Akın Emre Pilgir 6. Hayatımızdaki Algoritmalar: Günlük Kararların Bilgisayar Bilimi 7. Yaşam 3.0: Yapay Zeka Çağında İnsan Olmak 8. Büyük Veri İş Başında: 45 Yıldız Şirket Büyük Veri'yi Nasıl Kullandı?: 45 Yıldız Şirket Büyük Veriyi Nasıl Kullandı? |
Dersin Program Yeterliliklerine Katkısı
Dersin Program Yeterliliklerine Katkısı | |||||||
No | Program Yeterliliği | Katkı Düzeyi | |||||
1 | 2 | 3 | 4 | 5 | |||
1 | Bilişim ve yönetim alanında teorik bilgileri tanımlar. | X | |||||
2 | Bilişim ve yönetim alanında gerekli matematiksel ve istatistiki yöntemleri anlatır. | X | |||||
3 | Bilişim ve yönetim alanında gerekli en az bir bilgisayar programı kullanır. | X | |||||
4 | Bilişim ve yönetim alanında gerekli olan mesleki yabancı dil yeterliliğini gösterir. | ||||||
5 | Bilişim projeleri hazırlar ve takım çalışmalarını yönetir. | ||||||
6 | Mesleki alanda yaşam boyu öğrenmenin gerekliliği bilinciyle bilim ve teknolojideki gelişmeleri izleyerek kendini sürekli yenileyip edindiği bilgi ve becerileri eleştirel olarak değerlendirir. | X | |||||
7 | Bilişim ve yönetim alanında teorik ve uygulamaya yönelik bilgileri kullanır | X | |||||
8 | En az A1 düzeyinde bir yabancı dili kullanarak güncel teknolojileri takip eder, sözlü / yazılı iletişim kurar. | ||||||
9 | Örgüt / kurumsal, iş ve toplumsal etik değerlerini benimser ve kullanır. | ||||||
10 | Topluma hizmet duyarlılığı çerçevesinde, sosyal sorumluluk ilkelerini benimser ve gerektiğinde inisiyatif alır. | ||||||
11 | Disiplinler arası çalışmalar yürütebilmek için farklı disiplinlerde (ekonomi, finans, sosyoloji, hukuk, işletme) temel bilgileri ve verileri analiz ederek alanında kullanır. | X | |||||
12 | Masaüstü, mobil, web gibi farklı platform yazılımlarını tek başına ve/veya bir ekip içerisinde yazar. |
Değerlendirme Sistemi
Katkı Düzeyi | Mutlak Değerlendirme | |
Ara Sınavın Başarıya Oranı | 40 | |
Genel Sınavın Başarıya Oranı | 60 | |
Toplam | 100 |
AKTS / İşyükü Tablosu | ||||||
Etkinlik | Sayı | Süresi (Saat) | Toplam İş Yükü (Saat) | |||
Ders Saati | 14 | 3 | 42 | |||
Rehberli Problem Çözme | 2 | 10 | 20 | |||
Problem Çözümü / Ödev / Proje / Rapor Tanzimi | 12 | 2 | 24 | |||
Okul Dışı Diğer Faaliyetler | 2 | 7 | 14 | |||
Proje Sunumu / Seminer | 3 | 1 | 3 | |||
Kısa Sınav (QUİZ) ve Hazırlığı | 1 | 4 | 4 | |||
Ara Sınav ve Hazırlığı | 1 | 15 | 15 | |||
Genel Sınav ve Hazırlığı | 1 | 20 | 20 | |||
Performans Görevi, Bakım Planı | 0 | 0 | 0 | |||
Toplam İş Yükü (Saat) | 142 | |||||
Dersin AKTS Kredisi = Toplam İş Yükü (Saat)/30*=(142/30) | 5 | |||||
Dersin AKTS Kredisi: *30 saatlik çalışma 1 AKTS kredisi sayılmaktadır. |
Dersin Detaylı Bilgileri
Ders Tanımı
Ders | Kodu | Yarıyıl | T+U Saat | Kredi | AKTS |
---|---|---|---|---|---|
VERİ MADENCİLİĞİ VE İŞ ZEKASI | - | Güz Dönemi | 3+0 | 3 | 5 |
Ders Programı |
Ön Koşul Dersleri | |
Önerilen Seçmeli Dersler |
Dersin Dili | Türkçe |
Dersin Seviyesi | Lisans |
Dersin Türü | Zorunlu |
Dersin Koordinatörü | Prof.Dr. Gökhan SİLAHTAROĞLU |
Dersi Verenler | Prof.Dr. Gökhan SİLAHTAROĞLU |
Dersin Yardımcıları | |
Dersin Amacı | Öğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği mollerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir. |
Dersin İçeriği | Bu ders; Veri Madenciliğine Giriş,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar.,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme),Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram),Birliktelik Analizi (Alışveriş Sepeti Analizi),Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager),Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması),Regresyon ve Lojistik Regresyon,Yapay sinir Ağları (çalışma prensibi, Hyperparameters),Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL,Proje Sunumları - Değerlendirme; konularını içermektedir. |
Dersin Öğrenme Kazanımları | Öğretim Yöntemleri | Ölçme Yöntemleri |
1. Veri Tabanından veri ambarı üretebilecektir. | 16, 9 | A |
1.1. Veri Madenciliğini açıklar. | 16 | A |
1.2. Veri Ambarını tanımlar. | 16 | |
1.3. Yıldız veri ambarı modelini tasarlar. | ||
1.4. Ana tablolar birliği veri ambarı modelini tasarlar. | 6 | F |
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir. | 10, 9 | A |
2.1. Veri Madenciliği Modellerini tanımlar. | 16, 9 | A |
2.2. Sınıflandırma Kavramını tanımlar. | 16, 9 | |
2.3. Kümeleme kavramını tanımlar. | 16, 9 | |
2.4. Bağlantı analizi kavramını tanımlar. | 16, 9 | |
3. Sınıflandırma modelini uygulayabilecektir. | 14, 6, 9 | A, F |
3.1. Denetimli öğrenmeyi tanımlar. | 16, 9 | F |
3.2. Sınıf kavramını belirler. | 9 | A, F |
3.3. İstatistiksel algoritmaları sıralar. | 16 | |
3.4. Karar ağaçlarını uygular. | 16 | A, F |
3.5. Karar ağacı algoritmalarını tanımlar. | 16 | F |
3.6. Budama ve saflık değerlerini tanımlar. | 9 | |
4. Kümeleme modelini uygulayabilecektir. | 14, 16, 9 | A, F |
4.1. Denetimsiz Öğrenmeyi tanımlar. | 16, 9 | F |
4.2. Kümeleme kavramını açıklar. | 16, 9 | |
4.3. Kümeleme algoritmalarını sıralar. | F | |
4.4. K-means algoritmasını uygular. | 14 | F |
4.5. Genetik algoritmaları tanımlar. | F | |
5. Bağlantı analizi modelini uygulayabilecektir. | 14, 16, 9 | A, F |
5.1. Bağlantı analizi kurallarını yorumlar. | ||
5.2. Kaldıraç kavramını açıklar. | 16, 9 | |
5.3. İlişki analizi yöntemini uygular. | 14, 9 | |
5.4 Bağlantı analizi ile kümelemeyi birleştirir. | 2 | |
6. Veri madenciliği Algoritmalarını uygulayabilecektir. | 2 | F |
6.1. Sınıflandırma algoritmalarını veriler üzerinde uygular. | 2 | F |
6.2. Kümeleme algoritmalarını veriler üzerinde uygular. | 2 | F |
6.3. Bağlantı analizi algoritmalarını veriler üzerinde uygular. | 2 | F |
6.4. Veri madenciliği uygulama çıktılarını yorumlar. | 2 | F |
Öğretim Yöntemleri: | 10: Tartışma Yöntemi, 14: Bireysel Çalışma Yöntemi, 16: Soru - Cevap Tekniği , 2: Proje Temelli Öğrenme Modeli, 6: Deneyimle Öğrenme Modeli, 9: Anlatım Yöntemi |
Ölçme Yöntemleri: | A: Klasik Yazılı Sınav, F: Proje Görevi |
Ders Akışı
Sıra | Konular | Ön Hazırlık |
---|---|---|
1 | Veri Madenciliğine Giriş | |
2 | Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar. | |
3 | Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) | Veri İşlemleri Analizi Uygulama |
4 | Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) | |
5 | Birliktelik Analizi (Alışveriş Sepeti Analizi) | |
6 | Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: BEARS) | Uygulamalı Veri Analizi |
7 | Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) | |
8 | Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + Telco Uygulaması) | |
9 | Regresyon ve Lojistik Regresyon | |
10 | Yapay sinir Ağları (çalışma prensibi, Hyperparameters) | |
11 | Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer) | |
12 | Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN) | |
13 | Büyük Veri Konseptleri – HADOOP, Spark, MongoDB, NOSQL | |
14 | Proje Sunumları - Değerlendirme |
Kaynak |
1. Veri madenciliği kavram ve algoritmaları, Gökhan Silahtaroğlu, Papatya Yayıncılık. Knime Uygulama: https://docs.knime.com/ |
1. Çıplak İstatistik, Charles Wheelan 2. Araştırma Nasıl Tasarlanır Ve Raporlaştırılır, Andy Field ve Graham Hole 3. Master Algoritma 4. Homo İnformatiks: Bilişim Matematik ve Mantığın Kesişen Dünyaları 5. Matematiksel İmha Silahları: Büyük Veri, Eşitsizliği Nasıl Artırıp Demokrasiyi Tehdit Ediyor?, Cathy ONeil ve Akın Emre Pilgir 6. Hayatımızdaki Algoritmalar: Günlük Kararların Bilgisayar Bilimi 7. Yaşam 3.0: Yapay Zeka Çağında İnsan Olmak 8. Büyük Veri İş Başında: 45 Yıldız Şirket Büyük Veri'yi Nasıl Kullandı?: 45 Yıldız Şirket Büyük Veriyi Nasıl Kullandı? |
Dersin Program Yeterliliklerine Katkısı
Dersin Program Yeterliliklerine Katkısı | |||||||
No | Program Yeterliliği | Katkı Düzeyi | |||||
1 | 2 | 3 | 4 | 5 | |||
1 | Bilişim ve yönetim alanında teorik bilgileri tanımlar. | X | |||||
2 | Bilişim ve yönetim alanında gerekli matematiksel ve istatistiki yöntemleri anlatır. | X | |||||
3 | Bilişim ve yönetim alanında gerekli en az bir bilgisayar programı kullanır. | X | |||||
4 | Bilişim ve yönetim alanında gerekli olan mesleki yabancı dil yeterliliğini gösterir. | ||||||
5 | Bilişim projeleri hazırlar ve takım çalışmalarını yönetir. | ||||||
6 | Mesleki alanda yaşam boyu öğrenmenin gerekliliği bilinciyle bilim ve teknolojideki gelişmeleri izleyerek kendini sürekli yenileyip edindiği bilgi ve becerileri eleştirel olarak değerlendirir. | X | |||||
7 | Bilişim ve yönetim alanında teorik ve uygulamaya yönelik bilgileri kullanır | X | |||||
8 | En az A1 düzeyinde bir yabancı dili kullanarak güncel teknolojileri takip eder, sözlü / yazılı iletişim kurar. | ||||||
9 | Örgüt / kurumsal, iş ve toplumsal etik değerlerini benimser ve kullanır. | ||||||
10 | Topluma hizmet duyarlılığı çerçevesinde, sosyal sorumluluk ilkelerini benimser ve gerektiğinde inisiyatif alır. | ||||||
11 | Disiplinler arası çalışmalar yürütebilmek için farklı disiplinlerde (ekonomi, finans, sosyoloji, hukuk, işletme) temel bilgileri ve verileri analiz ederek alanında kullanır. | X | |||||
12 | Masaüstü, mobil, web gibi farklı platform yazılımlarını tek başına ve/veya bir ekip içerisinde yazar. |
Değerlendirme Sistemi
Katkı Düzeyi | Mutlak Değerlendirme | |
Ara Sınavın Başarıya Oranı | 40 | |
Genel Sınavın Başarıya Oranı | 60 | |
Toplam | 100 |