İş Analitiği ve Büyük Veri

R platformunda uygulamalı eğitim programı

İşletme yönetiminde doğru karar vermek için verileri kullanmak günümüzde rekabetin bir koşulu haline gelmiştir. Sektör fark etmeksizin, küçük veya büyük işletmelerin hedefleri doğrultusunda doğru kararlar verebilmesi ve doğru adımlar atabilmesi için veri odaklı bir yaklaşım sergilemeleri gerekmektedir. Ancak bunu yapabilmek için ham verileri karar destek amaçlı kullanılabilecek bilgilere dönüştürmek, verilerde gömülü olan bilgiyi ortaya çıkartmak gerekir.

Bu programının amacı iş kararlarını ve operasyonu iyileştirmek, ve veri üzerinden katma değer elde edilmesini sağlamak için gerekli kavram, yöntem ve araçları kapsayan uygulamalı bir eğitim vermektir. Program tasarımı yeni çıkan teknoloji ve veri analiz yöntemleri, ve bunların eski yöntemlerden farkı konusunda farkındalık yaratmak, veri bilimi (data science) konularında kendini gelişmek isteyen yönetici ve profesyoneller için temel becerileri geliştirmek üzerine kurulmuştur. Uygulamalı eğitimde sanayide en fazla tercih edilen analiz platformlarından olan R istatistik platformu ve ilgili modülleri öğretilmektedir. Ek olarak programın giriş düzeyi “büyük veri” bileşeni katılımcılara işletmelerindeki büyük veri ihtiyaçlarını teşhis etme, ve bu analizler için bir yol haritası oluşturma becerilerini kazandırma amaçlıdır.

Bu eğitimi alacak katılımcıların “Temel R” programını tamamlamış veya eşdeğer düzeyde R kullanımı bilgisine sahip olmaları beklenmektedir.

Eğitim süresi: 5 gün

1. Gün

Tahminlemenin temelleri, tahmin analitiğinde kalite ve uygulanabilirlik değerlendirmesi, resgresyon modellemesi

  • Tahminleme ve denetimli öğrenme yöntemleri
  • Doğrusal regresyon tahminlemesi
  • Tahminlemenin iş problemlerine uygulanması.
  • Tahminleme modelinin kalite ölçütleri ve değerlendirilmesi
  • Veri kalitesi ve tahminleme modellerini iyileştirme yöntemleri
  • Doğrusal regresyonun uygulanabilirlik koşulları.
  • İkili (binomial/logistic) regresyon
  • Çok terimli (multinomial) regresyon
  • Doğrusal olmayan regresyon alternatiflerinin değerlendirilmesi.

Zaman serisi modelleri ile gelecek tahminlemesi yapılması

  • Zaman serisi modellemesi ve modellerin tahmin kalitesi
  • Satış ve talep tahminlemesi
  • Zaman serisinin görselleştirilmesi
  • Zaman serileri ile satış vb. tahminlemesi
  • Veri özelliklerine uygun zaman serisi modellerinin seçimi

2. Gün

Kümeleme ve sınıflandırma ile müşteri ve ürünlerin segmentasyonu

  • Gizli kümelerin bulunması ve sınıflama arasındaki farklar ve iş problemlerindeki rolleri
  • Çok boyutlu verilerde benzerlik ve farklılık kavramlarının nicelenmesi
  • Veri büyüklüğü ve boyutlarına uygun kümeleme ve sınıflandırma teknikleri

Karar ağaçları ile sınıflandırma ve iş uygulamaları

  • Sayısal olmayan verilerle sınıflandırma yöntemleri: Karar ağacı modelleri
  • Veri entropisi ve karar ağacı modelinin temel özellikleri
  • Karar ağacı modellerinin görselleştirilmesi, okunması, ve hata matrisi ile kalite değerlendirmesinin yapılması
  • İş problemlerinde karar ağacı uygulamaları ve kalite ihtiyaçları, abonelik (churn) analizi problemleri
  • Rassal ormanlar (random forest) ve regresyon ağaçlarının kullanımı

3.Gün

Kümeleme

  • Kümelemenin temel yaklaşımı
  • Veri tipleri ve entropi kavramının uyarlanması
  • Kümelemenin çıkartılması ve görselleştirilmesi
  • Küme sayısının seçimi için teknikler
  • Elbow ve silouette grafikleri ile küme sayısı seçimi.

4. GÜn

Sınıflandırma teknikleri

  • K-means yöntemi ile sınıflama
  • KNN yöntemi ile sınıflama
  • Sınıflama yöntemlerinin problemlere uygunluğu
  • Sınıflama yöntemlerinin hata matrisi ile kalite ölçümü ve karşılaştırılması.

Sepet analizi ile müşteri satınalma davranışı tahminleme ve diğer uygulamalar

  • Alışveriş sepet analizi (association rule mining) modelleri
  • Sepet analizi kurallarının kalite değerlendirmesi
  • Kampanya tasarımı, e-ticaret tavsiye sistemleri, ek-satış, raf tasarımı, vb. iş problemlerinde sepet analizi uygulamaları.

5. Gün

Büyük veri Kavramları

  • Büyük veri ihtiyaçlarının teşhisi
  • Büyük veri analiz hattı ve tedariği
  • Büyük veri analizi için gerekli yetkinliklerin tespiti
  • Analitik ve büyük veri teknoloji değerlendirme kriterleri

Uygulamalı büyük veri analitiği

  • Map-Reduce ile analitik algoritmaları
  • Apache Hadoop mimarisi
  • Apache Spark ile map-reduce uygulama
  • Gerçek zamanlı veri işleme

Tavsiye sistemleri

  • Sepet analizinin ötesinde tavsiye sistemlerinden beklenenler.
  • Kişiye özel tavsiye algoritmaları ve veri gereksinimleri.
  • Eksik veri ile tavsiye.
  • Tavsiye kalitesinin ölçülmesi.

Metin analizi ve uygulamaları

  • Dijital metinlerin analizi ile müşteri ve çalışanların anlam dünyası ve duygu durumunun belirlenmesi.
  • Temel metin analizi matematiği
  • R ile uygulamalar
  • Metinlerin tasnifi yöntemleri ve bunların müşteri ilişkileri veya çağrı-merkezi yönetiminde kullanımı.

Ağ analizi ve uygulamaları

  • İlişkisel analiz
  • Sosyal ağ analizi ile marka etkileşimi analizi
  • Çalışan ağları ve verimlilik