Eğitim İçeriği

1. Derin Takviyeli Öğrenmeye Giriş

  • Takviyeli Öğrenme nedir?
  • Tekdüzen, Yınsız ve Takviyeli Öğrenim arasındaki farklar
  • 2025'te DRL'nin uygulamaları (robotik, sağlık hizmetleri, finans, lojistik)
  • Ajan-ortam etkileşim döngüsünü anlamak

2. Takviyeli Öğrenim Temelleri

  • Markov Karar Süreçleri (MDP)
  • Durum, Eylem, Ödül, Politika ve Değer fonksiyonları
  • Kaşiflik ile Kullanım arasındaki denge
  • Monte Carlo yöntemleri ve Zaman-Farkı (TD) öğrenimi

3. Temel RL Algoritmalarını Uygulama

  • Sıralı yöntemler: Dinamik Programlama, Politika Değerlendirme ve Yineleme
  • Q-Öğrenim ve SARSA
  • Epsilon-yerine getirici kaşiflik ve azalma stratejileri
  • OpenAI Gymnasium ile RL ortamları oluşturma

4. Derin Takviyeli Öğrenime Geçiş

  • Sıralı yöntemlerin sınırlamaları
  • Fonksiyon yaklaşımları için sinir ağlarının kullanımı
  • Derin Q-Çeviri (DQN) mimarisi ve iş akışı
  • Tecrübe oynatma ve hedef ağlar

5. İleri DRL Algoritmaları

  • Double DQN, Dueling DQN ve Öncelikli Deney Oynatma
  • Politika Gradyan Yöntemleri: REINFORCE algoritması
  • Actör-Kritik mimariler (A2C, A3C)
  • Yakınlaştırıcı Politika Optimizasyonu (PPO)
  • Yumuşak Actör-Kritik (SAC)

6. Sürekli Eylem Uzayları ile Çalışma

  • Sürekli kontroldeki zorluklar
  • DDPG (Derin Deterministik Politika Gradyanı) kullanmak
  • Twin Delayed DDPG (TD3)

7. Pratik Araçlar ve Çerçeveler

  • Stable-Baselines3 ve Ray RLlib kullanımı
  • TensorBoard ile günlüğe kaydetme ve izleme
  • DRL modelleri için hiperparametre ayarlaması

8. Ödül Mühendisliği ve Ortam Tasarımı

  • Ödül şekillendirme ve ceza dengeleme
  • Sımla-reel transfer öğrenimi kavramları
  • Gymnasium'da özel ortamlar oluşturma

9. Kısmen Gözlemlenebilir Ortamlar ve Genelleme

  • Eksik durum bilgisiyle başa çıkma (POMDP'ler)
  • LSTMs ve RNNs kullanarak hafıza tabanlı yaklaşımlar
  • Ajan dayanıklılığını ve genelleme performansını iyileştirme

10. Oyun Teorisi ve Çok-Ajan Takviyeli Öğrenimi

  • Çok-ajan ortamlarına giriş
  • Eşleme ile rekabet
  • Zıt eğitim ve strateji optimizasyonu uygulamaları

11. Vaka Çalışmaları ve Gerçek Hayat Uygulamaları

  • Otonom sürüş simülasyonları
  • Dinamik fiyatlandırma ve finansal işlem stratejileri
  • Robotik ve endüstriyel otomasyon

12. Sorun Giderme ve Optimizasyon

  • Kararsız eğitim tanılaması
  • Ödül seyrekliği ve aşırı uyum yönetimi
  • GPUs ve dağıtılmış sistemlerde DRL modellerini ölçeklendirme

13. Özet ve Sonraki Adımlar

  • DRL mimarisinin ve ana algoritmalarının özeti
  • Sektör trendleri ve araştırma yönleri (örneğin, RLHF, hibrit modeller)
  • Diğer kaynaklar ve okuma malzemeleri

Kurs İçin Gerekli Önbilgiler

  • Python programlamada yetkinlik
  • Türev ve Doğrusal Cebir anlayışı
  • Olasılık ve İstatistik konusunda temel bilgi
  • Python ve NumPy veya TensorFlow/PyTorch kullanarak makine öğrenme modelleri oluşturma deneyimi

Hedef Kitle

  • Yapay zeka (AI) ve akıllı sistemlerle ilgilenen geliştiriciler
  • Taşınabilir öğrenme çerçevelerini inceleyen Veri Bilimciler
  • Otonom sistemlerde çalışan Makine Öğrenmesi Mühendisleri
 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Danışanlarımızın Yorumları (5)

Yaklaşan Etkinlikler

İlgili Kategoriler