Bizi tercih ettiğiniz için teşekkür ederiz. Ekip üyelerimiz en kısa sürede sizlerle iletişime geçecektir.
Rezervasyonunuzu gönderdiğiniz için teşekkür ederiz! Ekibimizden bir yetkili kısa süre içinde sizinle iletişime geçecektir.
Eğitim İçeriği
Reinforse Öğrenme ve Agentic AI'ye Giriş
- Belirsizlik altında karar verme ve ardışık planlama
- RL'nin ana bileşenleri: ajanlar, ortamlar, durumlar ve ödüller
- RL'nin uyarlanabilir ve agentic AI sistemlerindeki rolü
Markov Karar Süreçleri (MDPs)
- MDP'lerin resmi tanımlaması ve özellikleri
- Değer fonksiyonları, Bellman denklemleri ve dinamik programlama
- Politika değerlendirmesi, iyileştirme ve iterasyon
Model-Free Reinforse Öğrenme
- Monte Carlo ve Zaman-Farkı (TD) öğrenme
- Q-öğrenme ve SARSA
- Python'da tabular RL yöntemlerini uygulama
Derin Reinforse Öğrenme
- Fonksiyon yaklaştırma için nöral ağlar ve RL'nin birleştirilmesi
- Derin Q-Ağı (DQN) ve deney oynatma
- Actor-Critic mimarileri ve politika gradyanları
- DQN ve PPO ile Stable-Baselines3 kullanarak bir ajanın eğitilmesi
Keşfetme Stratejileri ve Ödül Şekillendirme
- Keşfetmeyi ve exploitation'u dengelendirme (ε-greedy, UCB, entropi yöntemleri)
- Ödül fonksiyonları tasarlanması ve istenmeyen davranışların önlenmesi
- Ödül şekillendirme ve kademeli öğrenme
Reinforse Öğrenme ve Karar Vermede Gelişmiş Konular
- Çok ajanlı reinforse öğrenme ve işbirlikçi stratejiler
- Hiyerarşik reinforse öğrenme ve seçenekler çerçevesi
- Çevrimdışı RL ve örneklem öğrenme için daha güvenli dağıtım
Simülasyon Ortamları ve Değerlendirme
- OpenAI Gym ve özelleştirilmiş ortamların kullanımı
- Sürekli vs. ayrık eylem alanları
- Ajan performansı, kararlılık ve örnek verimliliği için metrikler
Agentic AI Sistemlerine RL'nin Entegrasyonu
- Karışık ajan mimarilerinde akıl yürütme ve RL'nin birleştirilmesi
- Aracı kullanan ajanlarla reinforse öğrenmenin entegrasyonu
- Ölçeklendirme ve dağıtım için operasyonel konular
Final Projesi
- Simüle edilmiş bir görev için reinforse öğrenme ajanı tasarlamak ve uygulamak
- Eğitimin performansını analiz etmek ve hiperparametreleri optimize etmek
- Agentic bağlama uyumlu davranışları ve karar vermeyi göstermek
Özeti ve Sonraki Adımlar
Kurs İçin Gerekli Önbilgiler
- Python programlama dilinde güçlü beceri
- Makine öğrenimi ve derin öğrenme kavramları hakkında sağlam bir anlayış
- Lineer cebir, olasılık ve temel optimizasyon yöntemleri ile tanışlık
Hedef Kitle
- Reinforse öğrenme mühendisleri ve uygulamalı AI araştırmacıları
- Robotik ve otomasyon geliştiricileri
- Uyarlanabilir ve agentic AI sistemleri üzerinde çalışan mühendislik ekibleri
28 Saatler
Danışanlarımızın Yorumları (2)
İyi bir bilgi ve uygulama karışımı
Ion Mironescu - Facultatea S.A.I.A.P.M.
Eğitim - Agentic AI for Enterprise Applications
Yapay Zeka Çevirisi
Teori ve uygulamanın bir araya gelmesi, yüksek seviye ve düşük seviye perspektiflerin karışımı
Ion Mironescu - Facultatea S.A.I.A.P.M.
Eğitim - Autonomous Decision-Making with Agentic AI
Yapay Zeka Çevirisi