Eğitim İçeriği
Reinforse Öğrenme ve Agentic AI'ye Giriş
- Belirsizlik altında karar verme ve ardışık planlama
- RL'nin ana bileşenleri: ajanlar, ortamlar, durumlar ve ödüller
- RL'nin uyarlanabilir ve agentic AI sistemlerindeki rolü
Markov Karar Süreçleri (MDPs)
- MDP'lerin resmi tanımlaması ve özellikleri
- Değer fonksiyonları, Bellman denklemleri ve dinamik programlama
- Politika değerlendirmesi, iyileştirme ve iterasyon
Model-Free Reinforse Öğrenme
- Monte Carlo ve Zaman-Farkı (TD) öğrenme
- Q-öğrenme ve SARSA
- Python'da tabular RL yöntemlerini uygulama
Derin Reinforse Öğrenme
- Fonksiyon yaklaştırma için nöral ağlar ve RL'nin birleştirilmesi
- Derin Q-Ağı (DQN) ve deney oynatma
- Actor-Critic mimarileri ve politika gradyanları
- DQN ve PPO ile Stable-Baselines3 kullanarak bir ajanın eğitilmesi
Keşfetme Stratejileri ve Ödül Şekillendirme
- Keşfetmeyi ve exploitation'u dengelendirme (ε-greedy, UCB, entropi yöntemleri)
- Ödül fonksiyonları tasarlanması ve istenmeyen davranışların önlenmesi
- Ödül şekillendirme ve kademeli öğrenme
Reinforse Öğrenme ve Karar Vermede Gelişmiş Konular
- Çok ajanlı reinforse öğrenme ve işbirlikçi stratejiler
- Hiyerarşik reinforse öğrenme ve seçenekler çerçevesi
- Çevrimdışı RL ve örneklem öğrenme için daha güvenli dağıtım
Simülasyon Ortamları ve Değerlendirme
- OpenAI Gym ve özelleştirilmiş ortamların kullanımı
- Sürekli vs. ayrık eylem alanları
- Ajan performansı, kararlılık ve örnek verimliliği için metrikler
Agentic AI Sistemlerine RL'nin Entegrasyonu
- Karışık ajan mimarilerinde akıl yürütme ve RL'nin birleştirilmesi
- Aracı kullanan ajanlarla reinforse öğrenmenin entegrasyonu
- Ölçeklendirme ve dağıtım için operasyonel konular
Final Projesi
- Simüle edilmiş bir görev için reinforse öğrenme ajanı tasarlamak ve uygulamak
- Eğitimin performansını analiz etmek ve hiperparametreleri optimize etmek
- Agentic bağlama uyumlu davranışları ve karar vermeyi göstermek
Özeti ve Sonraki Adımlar
Kurs İçin Gerekli Önbilgiler
- Python programlama dilinde güçlü beceri
- Makine öğrenimi ve derin öğrenme kavramları hakkında sağlam bir anlayış
- Lineer cebir, olasılık ve temel optimizasyon yöntemleri ile tanışlık
Hedef Kitle
- Reinforse öğrenme mühendisleri ve uygulamalı AI araştırmacıları
- Robotik ve otomasyon geliştiricileri
- Uyarlanabilir ve agentic AI sistemleri üzerinde çalışan mühendislik ekibleri
Danışanlarımızın Yorumları (3)
İyi bir bilgi ve uygulama karışımı
Ion Mironescu - Facultatea S.A.I.A.P.M.
Eğitim - Agentic AI for Enterprise Applications
Yapay Zeka Çevirisi
Teori ve uygulamanın bir araya gelmesi, yüksek seviye ve düşük seviye perspektiflerin karışımı
Ion Mironescu - Facultatea S.A.I.A.P.M.
Eğitim - Autonomous Decision-Making with Agentic AI
Yapay Zeka Çevirisi
pratik alıştırmalar
Daniel - Facultatea S.A.I.A.P.M.
Eğitim - Agentic AI in Multi-Agent Systems
Yapay Zeka Çevirisi