Eğitim İçeriği

Giriş

  • Olumlu pekiştirme yoluyla öğrenme

Element’lerin Reinforcement Learning’i

Önemli Terimler (Eylemler, Durumlar, Ödüller, Politika, Değer, Q-Değeri, vb.)

Tablosal Çözüm Yöntemlerine Genel Bakış

Yazılım Aracısı Oluşturma

Değer Temelli, Politika Temelli ve Model Temelli Yaklaşımları Anlama

Markov Karar Süreci (MDP) ile Çalışma

Politikaların Bir Aracının Davranış Şeklini Nasıl Tanımladığı

Monte Carlo Yöntemlerini Kullanma

Geçici Fark Öğrenimi

n-adımlı Bootstrap eşleme

Yaklaşık Çözüm Yöntemleri

Yaklaşımla On-Politika Tahmini

Yaklaşımla On-Politika Kontrolü

Yaklaşımla Dış-Politika Yöntemleri

Uygunluk İzlerini Anlama

Politika Gradyan Yöntemlerini Kullanma

Özet ve Sonuç

Kurs İçin Gerekli Önbilgiler

  • Makine öğrenimi deneyimi
  • Programming deneyim

Hedef Kitle

  • Veri bilimcileri
 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Yaklaşan Etkinlikler

İlgili Kategoriler