Eğitim İçeriği
Machine Learning Giriş
- Makine öğrenimi türleri – denetimli vs. denetimsiz
- İstatistiksel öğrenmeden makine öğrenimine geçiş
- Veri madenciliği iş akışı: işletme anlayışı, veri hazırlığı, modelleme, dağıtım
- Görev için doğru algoritmanın seçilmesi
- Ayakta kalma ve sapma-varians dengesizliği
Python ve ML Kütüphaneleri Genel Bakış
- Makine öğrenimi için programlama dillerinin kullanılmasının nedeni
- R ile Python arasında seçim yapma
- Python hızlı başlangıç ve Jupyter Notedefterleri
- Python kütüphaneleri: pandas, NumPy, scikit-learn, matplotlib, seaborn
Makine Öğrenimi Algoritmalarının Testi ve Değerlendirilmesi
- Genelleme, ayakta kalma ve model doğrulama
- Değerlendirme stratejileri: ayırma kümesi, çapraz geçerleme, örsel örneklemek
- Regresyon için ölçüm birimleri: ME, MSE, RMSE, MAPE
- Sınıflandırma için ölçüm birimleri: doğruluk oranı, karışıklık matrisi, dengesiz sınıflar
- Model performans görselleştirme: karlılık eğrisi, ROC eğrisi, yükseltme eğrisi
- Model seçimi ve grid araması ayarlama için
Veri Hazırlığı
- Python içinde veri içe aktarma ve depolama
- Araştırma analizi ve özeti istatistikler
- Eksik değerleri ve aykırı değerleri işlemek
- Standartlaştırma, normalleştirme ve dönüşüm
- Nitel veriyi yeniden kodlama ve pandas ile veri işleme
Sınıflandırma Algoritmaları
- İkili vs. çoklu sınıflandırma
- Lojistik regresyon ve ayırt edici fonksiyonlar
- Beyazgür, k-en yakın komşu
- Ağaç kararları: CART, Random Forests, Bagging, Boosting, XGBoost
- Destek vektör makineleri ve çekirdekler
- Kombine öğrenme teknikleri
Regresyon ve Sayısal Tahmin
- En küçük kareler ve değişken seçimi
- Düzenleme yöntemleri: L1, L2
- Birinci derece regresyon ve doğrusal olmayan modeller
- Regresyon ağaçları ve spline eğrileri
Neural Networks
- Sinir ağlarına ve derin öğrenmeye giriş
- Etkileşim fonksiyonları, katmanlar ve geri yayılım
- Birden çok katmanlı algılayıcılar (MLP)
- Temel sinir ağı modelleme için TensorFlow veya PyTorch'ün kullanımı
- Sınıflandırma ve regresyon için sinir ağları
Satış Forecasting ve Predictive Analytics
- Zaman serisi vs. regresyon tabanlı tahmin
- Mevkiye ve trende dayalı verileri işlemek
- ML tekniklerini kullanarak satış tahmini modeli oluşturma
- Tahmin doğruluğunu ve belirsizliğini değerlendirmek
- Business sonuçların yorumlanması ve iletişim kurma
Unsupervised Learning
- Gruplandırma teknikleri: k-ortalamalar, k-medoidlar, hiyerarşik gruplandırma, SOMs
- Bölüm boyutu azaltma: PCA, faktör analizi, SVD
- Çok boyutlu ölçeklendirme
Metin Madenciliği
- Metin ön işleme ve tokenizasyon
- Bağlı sözcükler, kök bulma ve lemmatization
- Duygu analizi ve kelime frekansı
- Metin verilerini görselleştirme için kelime bulutları
Tavsiye Sistemleri
- Kullanıcı tabanlı ve ürün tabanlı işbirlikçi süzgeçler
- Tavsiye motorlarının tasarımını ve değerlendirmesini yapma
Bağlılık Desen Madenciliği
- Sıklık öğe kümeleri ve Apriori algoritması
- Pazar sepeti analizi ve yükseltme oranı
Aykırı Değer Tespit
- Çok yüksek değerlerin analizi
- Mesafe tabanlı ve yoğunluk tabanlı yöntemler
- Yüksek boyutlu verilerde aykırı değer tespiti
Machine Learning Durum Çalışması
- İşletme sorununu anlamak
- Veri ön işleme ve özellik mühendisliği
- Model seçimi ve parametre ayarlama
- Değerlendirme ve bulguların sunumu
- Dağıtım
Özet ve Sonraki Adımlar
Kurs İçin Gerekli Önbilgiler
- Makine öğrenimi kavramları (öncül ve önsüz öğrenme) hakkında temel bilgi
- Python programlama ile tanım (değişkenler, döngüler, fonksiyonlar)
- Pandas veya NumPy gibi kitaplıkları kullanarak veri işleme deneyimi olmak faydalı olsa da zorunlu değildir
- Gelişmiş modelleme veya sinir ağlarıyla önceki deneyim beklenmiyor
Hedef Kitle
- Veri bilimciler
- Business analistleri
- Veri ile çalışan yazılım mühendisleri ve teknik uzmanlar
Danışanlarımızın Yorumları (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Eğitim - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.