Eğitim İçeriği
Makine Öğrenimi Giriş
- Makine öğreniminin türleri – gözetimli ve gözetimsiz öğrenim
- İstatistiksel öğrenimden makine öğrenimine geçiş
- Veri madenciliği iş akışı: iş anlayışı, veri hazırlığı, modelleme, dağıtım
- Görev için doğru algoritmayı seçme
- Aşırı uyum ve bias-variance dengelemesi
Python ve ML Kütüphaneleri Genel Bakış
- Neden programlama dillerini makine öğrenimi için kullanmalıyız
- R ile Python arasında seçim yapma
- Python hızlı kursu ve Jupyter Notbooks
- Python kütüphaneleri: pandas, NumPy, scikit-learn, matplotlib, seaborn
ML Algoritmalarının Testi ve Değerlendirilmesi
- Genelleme, aşırı uyum ve model doğrulaması
- Değerlendirme stratejileri: holdout, çapraz-doğrulama, bootstrapping
- Regresyon için metrikler: ME, MSE, RMSE, MAPE
- Sınıflandırma için metrikler: doğruluk, karışım matrisi, dengesiz sınıflar
- Model performansı görselleştirmesi: kar getirme eğrisi, ROC eğrisi, lift eğrisi
- Model seçimi ve hiperparametre ayarı için grid search
Veri Hazırlama
- Python'da verinin içe aktarılması ve depolanması
- Keşfedici analiz ve özeti istatistikler
- Eksik değerleri ve aykırı değerleri yönetme
- Standartlaştırma, normalleştirme ve dönüşüm
- Nitel verilerin kodlanması ve pandas ile veri hazırlığı
Sınıflandırma Algoritmaları
- İkili ve çoklu sınıflandırma
- Lojistik regresyon ve ayrım fonksiyonları
- Naive Bayes, k-en yakın komşular (k-NN)
- Karar ağaçları: CART, Rastgele Ormanlar (Random Forests), Bagging, Boosting, XGBoost
- Destek Vektör Makineleri ve çekirdekler (kernels)
- Toplu öğrenme teknikleri
Regresyon ve Sayısal Tahmin
- En küçük kareler ve değişken seçimi
- Düzenleme yöntemleri: L1, L2
- Polinom regresyon ve doğrusal olmayan modeller
- Regresyon ağaçları ve spline fonksiyonlar
Sinir Ağları
- Sinir ağlarına ve derin öğrenmeye giriş
- Aktivasyon fonksiyonları, katmanlar ve geri yayılım (backpropagation)
- Çok katmanlı algılayıcılar (Multilayer Perceptrons - MLP)
- Temel sinir ağ modellemesi için TensorFlow veya PyTorch kullanımı
- Sinir ağları sınıflandırma ve regresyon için kullanımları
Satış Tahmini ve Tahminsel Analitikler
- Zaman serisi tahminleri ile regresyon tabanlı tahminler arasındaki farklar
- Sezonsal ve trend tabanlı verilerin yönetimi
- ML teknikleri kullanarak bir satış tahmini modeli oluşturma
- Tahmin doğruluğunu ve belirsizliği değerlendirme
- Sonuçların iş yorumu ve iletişim kurulması
Gözetimsiz Öğrenim
- Kümeleme teknikleri: k-ortalamalar (k-means), k-medoids, hiyerarşik kümeleme, SOM'lar
- Boyut azaltımı: PCA, faktör analizi, SVD
- Çok boyutlu ölçeklendirme
Metin Madenciliği
- Metin ön işlemi ve tokenizasyon
- Kelime torbası (bag-of-words), kök bulma (stemming) ve çekim (lemmatization)
- Duygu analizi ve kelime sıklığı
- Metin verilerinin görselleştirilmesi: kelime bulutları (word clouds)
Tavsiye Sistemleri
- Kullanıcıya dayalı ve ögeye dayalı işbirsel filtreleme
- Tavsiye motorlarının tasarlanması ve değerlendirilmesi
İlişki Deseni Madenciliği
- Sık öge kümeleri (frequent itemsets) ve Apriori algoritması
- Piyasa sepet analizi ve lift oranı
Aykırı Değer Tespiti
- Extrem değer analizi
- Mesafe tabanlı ve yoğunluk tabanlı yöntemler
- Yüksek boyutlu verilerde aykırı değer tespiti
Makine Öğrenimi Case Study
- İş problemi anlayışı
- Veri ön işlemesi ve özellik mühendisliği
- Model seçimi ve hiperparametre ayarı
- Bulguların değerlendirilmesi ve sunumu
- Dağıtım
Özet ve Sonraki Adımlar
Kurs İçin Gerekli Önbilgiler
- Makine öğrenimi kavramlarının (gözlemli ve gözlem dışı öğrenme) temel bilgisi
- Python programlama (değişkenler, döngüler, fonksiyonlar) bilgisine sahip olmak
- pandas veya NumPy gibi kütüphaneler kullanarak veri işleme deneyimi faydalıdır ancak zorunlu değildir
- Gelişmiş modelleme veya sinir ağları konusunda önceki deneyim beklentisi yoktur
Hedef Kitle
- Veri bilimcileri
- İş analistleri
- Veriyle çalışan yazılım mühendisleri ve teknik profesyoneller
Danışanlarımızın Yorumları (2)
ML ekosistemi sadece MLFlow değil, aynı zamanda Optuna, hyperops, docker ve docker-compose'i de içerir.
Guillaume GAUTIER - OLEA MEDICAL
Eğitim - MLflow
Yapay Zeka Çevirisi
Kubeflow eğitimine katılmayı keyitledim, bu eğitim uzaktan düzenlendi. Bu eğitim, AWS hizmetleri, K8s ve Kubeflow'ün etrafındaki tüm devOps araçları konusundaki bilgilerimi pekiştirmemi sağladı; bu da konuyu doğru bir şekilde ele alabilmek için gerekli temellerdir. Malawski Marcin'e eğitim ve en iyi uygulamalar hakkında tavsiyeleri için sabrından ve profesyonellikten dolayı teşekkür etmek istiyorum. Malawski, farklı açılardan, farklı dağıtım araçları Ansible, EKS kubectl, Terraform gibi konuları ele alır. Şimdi kesinlikle kendimin doğru uygulama alanında olduğunu düşünüyorum.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Eğitim - Kubeflow
Yapay Zeka Çevirisi