Eğitim İçeriği
1. Derin Takviyeli Öğrenmeye Giriş
- Takviyeli Öğrenme nedir?
- Tekdüzen, Yınsız ve Takviyeli Öğrenim arasındaki farklar
- 2025'te DRL'nin uygulamaları (robotik, sağlık hizmetleri, finans, lojistik)
- Ajan-ortam etkileşim döngüsünü anlamak
2. Takviyeli Öğrenim Temelleri
- Markov Karar Süreçleri (MDP)
- Durum, Eylem, Ödül, Politika ve Değer fonksiyonları
- Kaşiflik ile Kullanım arasındaki denge
- Monte Carlo yöntemleri ve Zaman-Farkı (TD) öğrenimi
3. Temel RL Algoritmalarını Uygulama
- Sıralı yöntemler: Dinamik Programlama, Politika Değerlendirme ve Yineleme
- Q-Öğrenim ve SARSA
- Epsilon-yerine getirici kaşiflik ve azalma stratejileri
- OpenAI Gymnasium ile RL ortamları oluşturma
4. Derin Takviyeli Öğrenime Geçiş
- Sıralı yöntemlerin sınırlamaları
- Fonksiyon yaklaşımları için sinir ağlarının kullanımı
- Derin Q-Çeviri (DQN) mimarisi ve iş akışı
- Tecrübe oynatma ve hedef ağlar
5. İleri DRL Algoritmaları
- Double DQN, Dueling DQN ve Öncelikli Deney Oynatma
- Politika Gradyan Yöntemleri: REINFORCE algoritması
- Actör-Kritik mimariler (A2C, A3C)
- Yakınlaştırıcı Politika Optimizasyonu (PPO)
- Yumuşak Actör-Kritik (SAC)
6. Sürekli Eylem Uzayları ile Çalışma
- Sürekli kontroldeki zorluklar
- DDPG (Derin Deterministik Politika Gradyanı) kullanmak
- Twin Delayed DDPG (TD3)
7. Pratik Araçlar ve Çerçeveler
- Stable-Baselines3 ve Ray RLlib kullanımı
- TensorBoard ile günlüğe kaydetme ve izleme
- DRL modelleri için hiperparametre ayarlaması
8. Ödül Mühendisliği ve Ortam Tasarımı
- Ödül şekillendirme ve ceza dengeleme
- Sımla-reel transfer öğrenimi kavramları
- Gymnasium'da özel ortamlar oluşturma
9. Kısmen Gözlemlenebilir Ortamlar ve Genelleme
- Eksik durum bilgisiyle başa çıkma (POMDP'ler)
- LSTMs ve RNNs kullanarak hafıza tabanlı yaklaşımlar
- Ajan dayanıklılığını ve genelleme performansını iyileştirme
10. Oyun Teorisi ve Çok-Ajan Takviyeli Öğrenimi
- Çok-ajan ortamlarına giriş
- Eşleme ile rekabet
- Zıt eğitim ve strateji optimizasyonu uygulamaları
11. Vaka Çalışmaları ve Gerçek Hayat Uygulamaları
- Otonom sürüş simülasyonları
- Dinamik fiyatlandırma ve finansal işlem stratejileri
- Robotik ve endüstriyel otomasyon
12. Sorun Giderme ve Optimizasyon
- Kararsız eğitim tanılaması
- Ödül seyrekliği ve aşırı uyum yönetimi
- GPUs ve dağıtılmış sistemlerde DRL modellerini ölçeklendirme
13. Özet ve Sonraki Adımlar
- DRL mimarisinin ve ana algoritmalarının özeti
- Sektör trendleri ve araştırma yönleri (örneğin, RLHF, hibrit modeller)
- Diğer kaynaklar ve okuma malzemeleri
Kurs İçin Gerekli Önbilgiler
- Python programlamada yetkinlik
- Türev ve Doğrusal Cebir anlayışı
- Olasılık ve İstatistik konusunda temel bilgi
- Python ve NumPy veya TensorFlow/PyTorch kullanarak makine öğrenme modelleri oluşturma deneyimi
Hedef Kitle
- Yapay zeka (AI) ve akıllı sistemlerle ilgilenen geliştiriciler
- Taşınabilir öğrenme çerçevelerini inceleyen Veri Bilimciler
- Otonom sistemlerde çalışan Makine Öğrenmesi Mühendisleri
Danışanlarımızın Yorumları (5)
Hunter harika, çok cazip, müthiş bilgili ve şahsiyetli. Çok iyi yapıldı.
Rick Johnson - Laramie County Community College
Eğitim - Artificial Intelligence (AI) Overview
Yapay Zeka Çevirisi
Very flexible.
Frank Ueltzhoffer
Eğitim - Artificial Neural Networks, Machine Learning and Deep Thinking
Yapay Zeka Çevirisi
I liked the new insights in deep machine learning.
Josip Arneric
Eğitim - Neural Network in R
Yapay Zeka Çevirisi
Ann created a great environment to ask questions and learn. We had a lot of fun and also learned a lot at the same time.
Gudrun Bickelq
Eğitim - Introduction to the use of neural networks
Yapay Zeka Çevirisi
It was very interactive and more relaxed and informal than expected. We covered lots of topics in the time and the trainer was always receptive to talking more in detail or more generally about the topics and how they were related. I feel the training has given me the tools to continue learning as opposed to it being a one off session where learning stops once you've finished which is very important given the scale and complexity of the topic.
Jonathan Blease
Eğitim - Artificial Neural Networks, Machine Learning, Deep Thinking
Yapay Zeka Çevirisi
 
                    