Eğitim İçeriği

Reinforse Öğrenme ve Agentic AI'ye Giriş

  • Belirsizlik altında karar verme ve ardışık planlama
  • RL'nin ana bileşenleri: ajanlar, ortamlar, durumlar ve ödüller
  • RL'nin uyarlanabilir ve agentic AI sistemlerindeki rolü

Markov Karar Süreçleri (MDPs)

  • MDP'lerin resmi tanımlaması ve özellikleri
  • Değer fonksiyonları, Bellman denklemleri ve dinamik programlama
  • Politika değerlendirmesi, iyileştirme ve iterasyon

Model-Free Reinforse Öğrenme

  • Monte Carlo ve Zaman-Farkı (TD) öğrenme
  • Q-öğrenme ve SARSA
  • Python'da tabular RL yöntemlerini uygulama

Derin Reinforse Öğrenme

  • Fonksiyon yaklaştırma için nöral ağlar ve RL'nin birleştirilmesi
  • Derin Q-Ağı (DQN) ve deney oynatma
  • Actor-Critic mimarileri ve politika gradyanları
  • DQN ve PPO ile Stable-Baselines3 kullanarak bir ajanın eğitilmesi

Keşfetme Stratejileri ve Ödül Şekillendirme

  • Keşfetmeyi ve exploitation'u dengelendirme (ε-greedy, UCB, entropi yöntemleri)
  • Ödül fonksiyonları tasarlanması ve istenmeyen davranışların önlenmesi
  • Ödül şekillendirme ve kademeli öğrenme

Reinforse Öğrenme ve Karar Vermede Gelişmiş Konular

  • Çok ajanlı reinforse öğrenme ve işbirlikçi stratejiler
  • Hiyerarşik reinforse öğrenme ve seçenekler çerçevesi
  • Çevrimdışı RL ve örneklem öğrenme için daha güvenli dağıtım

Simülasyon Ortamları ve Değerlendirme

  • OpenAI Gym ve özelleştirilmiş ortamların kullanımı
  • Sürekli vs. ayrık eylem alanları
  • Ajan performansı, kararlılık ve örnek verimliliği için metrikler

Agentic AI Sistemlerine RL'nin Entegrasyonu

  • Karışık ajan mimarilerinde akıl yürütme ve RL'nin birleştirilmesi
  • Aracı kullanan ajanlarla reinforse öğrenmenin entegrasyonu
  • Ölçeklendirme ve dağıtım için operasyonel konular

Final Projesi

  • Simüle edilmiş bir görev için reinforse öğrenme ajanı tasarlamak ve uygulamak
  • Eğitimin performansını analiz etmek ve hiperparametreleri optimize etmek
  • Agentic bağlama uyumlu davranışları ve karar vermeyi göstermek

Özeti ve Sonraki Adımlar

Kurs İçin Gerekli Önbilgiler

  • Python programlama dilinde güçlü beceri
  • Makine öğrenimi ve derin öğrenme kavramları hakkında sağlam bir anlayış
  • Lineer cebir, olasılık ve temel optimizasyon yöntemleri ile tanışlık

Hedef Kitle

  • Reinforse öğrenme mühendisleri ve uygulamalı AI araştırmacıları
  • Robotik ve otomasyon geliştiricileri
  • Uyarlanabilir ve agentic AI sistemleri üzerinde çalışan mühendislik ekibleri
 28 Saat

Katılımcı Sayısı


Katılımca başına fiyat

Danışanlarımızın Yorumları (3)

Yaklaşan Etkinlikler

İlgili Kategoriler