Eğitim İçeriği
1. Derin Takviyeli Öğrenmeye Giriş
- Takviyeli Öğrenme nedir?
- Tekdüzen, Yınsız ve Takviyeli Öğrenim arasındaki farklar
- 2025'te DRL'nin uygulamaları (robotik, sağlık hizmetleri, finans, lojistik)
- Ajan-ortam etkileşim döngüsünü anlamak
2. Takviyeli Öğrenim Temelleri
- Markov Karar Süreçleri (MDP)
- Durum, Eylem, Ödül, Politika ve Değer fonksiyonları
- Kaşiflik ile Kullanım arasındaki denge
- Monte Carlo yöntemleri ve Zaman-Farkı (TD) öğrenimi
3. Temel RL Algoritmalarını Uygulama
- Sıralı yöntemler: Dinamik Programlama, Politika Değerlendirme ve Yineleme
- Q-Öğrenim ve SARSA
- Epsilon-yerine getirici kaşiflik ve azalma stratejileri
- OpenAI Gymnasium ile RL ortamları oluşturma
4. Derin Takviyeli Öğrenime Geçiş
- Sıralı yöntemlerin sınırlamaları
- Fonksiyon yaklaşımları için sinir ağlarının kullanımı
- Derin Q-Çeviri (DQN) mimarisi ve iş akışı
- Tecrübe oynatma ve hedef ağlar
5. İleri DRL Algoritmaları
- Double DQN, Dueling DQN ve Öncelikli Deney Oynatma
- Politika Gradyan Yöntemleri: REINFORCE algoritması
- Actör-Kritik mimariler (A2C, A3C)
- Yakınlaştırıcı Politika Optimizasyonu (PPO)
- Yumuşak Actör-Kritik (SAC)
6. Sürekli Eylem Uzayları ile Çalışma
- Sürekli kontroldeki zorluklar
- DDPG (Derin Deterministik Politika Gradyanı) kullanmak
- Twin Delayed DDPG (TD3)
7. Pratik Araçlar ve Çerçeveler
- Stable-Baselines3 ve Ray RLlib kullanımı
- TensorBoard ile günlüğe kaydetme ve izleme
- DRL modelleri için hiperparametre ayarlaması
8. Ödül Mühendisliği ve Ortam Tasarımı
- Ödül şekillendirme ve ceza dengeleme
- Sımla-reel transfer öğrenimi kavramları
- Gymnasium'da özel ortamlar oluşturma
9. Kısmen Gözlemlenebilir Ortamlar ve Genelleme
- Eksik durum bilgisiyle başa çıkma (POMDP'ler)
- LSTMs ve RNNs kullanarak hafıza tabanlı yaklaşımlar
- Ajan dayanıklılığını ve genelleme performansını iyileştirme
10. Oyun Teorisi ve Çok-Ajan Takviyeli Öğrenimi
- Çok-ajan ortamlarına giriş
- Eşleme ile rekabet
- Zıt eğitim ve strateji optimizasyonu uygulamaları
11. Vaka Çalışmaları ve Gerçek Hayat Uygulamaları
- Otonom sürüş simülasyonları
- Dinamik fiyatlandırma ve finansal işlem stratejileri
- Robotik ve endüstriyel otomasyon
12. Sorun Giderme ve Optimizasyon
- Kararsız eğitim tanılaması
- Ödül seyrekliği ve aşırı uyum yönetimi
- GPUs ve dağıtılmış sistemlerde DRL modellerini ölçeklendirme
13. Özet ve Sonraki Adımlar
- DRL mimarisinin ve ana algoritmalarının özeti
- Sektör trendleri ve araştırma yönleri (örneğin, RLHF, hibrit modeller)
- Diğer kaynaklar ve okuma malzemeleri
Kurs İçin Gerekli Önbilgiler
- Python programlamada yetkinlik
- Türev ve Doğrusal Cebir anlayışı
- Olasılık ve İstatistik konusunda temel bilgi
- Python ve NumPy veya TensorFlow/PyTorch kullanarak makine öğrenme modelleri oluşturma deneyimi
Hedef Kitle
- Yapay zeka (AI) ve akıllı sistemlerle ilgilenen geliştiriciler
- Taşınabilir öğrenme çerçevelerini inceleyen Veri Bilimciler
- Otonom sistemlerde çalışan Makine Öğrenmesi Mühendisleri
Danışanlarımızın Yorumları (3)
Gerçekten, CHAT GPT ile oynamak için ayırdığımız zamanı çok beğendim. Bu etkinlik için odanın düzeni en ideal değildi - büyük bir masa yerine, küçük gruplara ayrılıp fikir üretmeye yardımcı olacak birkaç küçük masa olması daha iyi olurdu.
Nola - Laramie County Community College
Eğitim - Artificial Intelligence (AI) Overview
Yapay Zeka Çevirisi
Odaklanarak ilk ilkelerden başlamak ve aynı gün içinde örneklem uygulamalarına geçmek
Maggie Webb - Department of Jobs, Regions, and Precincts
Eğitim - Artificial Neural Networks, Machine Learning, Deep Thinking
Yapay Zeka Çevirisi
Gerçek şirket verilerinin kullanıldığını görüyorduk. Eğitmen, katılımcıların katılımını ve yarışmasını sağlayarak çok iyi bir yaklaşım sergiledi.
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Eğitim - Applied AI from Scratch in Python
Yapay Zeka Çevirisi