Eğitim İçeriği

Mastra Hata Ayıklama ve Değerlendirme Temelleri

  • Ajan davranış modellerini ve başarısızlık modlarını anlama
  • Mastra içindeki temel hata ayıklama ilkeleri
  • Belirleyici ve belirsiz ajan eylemlerinin değerlendirilmesi

Ajan Testi İçin Ortamların Kurulması

  • Test kumhanelerini ve izole değerlendirme alanlarını yapılandırma
  • Detaylı analiz için günlükleri, izlemeleri ve telemetrileri yakalama
  • Yapılandırılmış test için veri kümelerini ve istemcileri hazırlama

AI Ajan Davranışı Hata Ayıklaması

  • Karar yollarını ve iç nedenlendirme sinyallerini izleme
  • Hayal kurmayı, hataları ve beklenmeyen davranışları tespit etme
  • Kök neden araştırması için gözlemlenebilirlik panolarını kullanma

Değerlendirme Metrikleri ve Bencil Değerleme Çatıları

  • Nicel ve nitel değerlendirme metriklerinin tanımlanması
  • Doğruluğun, tutarlılığın ve bağlam uyumunun ölçülmesi
  • Tekrarlanabilir değerlendirme için bencil veri kümelerinin uygulanması

AI Ajanları için Güvenilirlik Mühendisliği

  • Uzun süre çalışan ajanlar için güvenilirlik testlerinin tasarlanması
  • Ajan performansındaki sapmayı ve bozulmayı tespit etme
  • Kritik iş akışları için güvenlik önlemlerinin uygulanması

Kalite Güvencesi Süreçleri ve Otomasyonu

  • Sürekli değerlendirme için kalite güvencesi hortlaklarının oluşturulması
  • Ajan güncellemeleri için otomatik geri dönüş testlerini uygulama
  • Kalite güvencesinin CI/CD ve kurumsal iş akışlarıyla entegrasyonu

Gelişmiş Hayal Kurma Azaltma Teknikleri

  • İstenmeyen çıktıları azaltmak için istem stratejileri
  • Doğrulama döngüleri ve kendini kontrol mekanizmaları
  • Güvenilirliği artırmak için model kombinasyonları ile deneme yapma

Raporlama, İzleme ve Sürekli Geliştirme

  • Kalite güvencesi raporları ve ajan puan kartlarının geliştirilmesi
  • Uzun süreli davranış ve hata desenlerinin izlenmesi
  • Evrim gösteren sistemler için değerlendirme çerçevelerinin iterasyonu

Özet ve Son Adımlar

Kurs İçin Gerekli Önbilgiler

  • AI ajan davranışları ve model etkileşimlerini anlama
  • Karmaşık yazılım sistemlerinin hata ayıklamasını veya testini deneyimleme
  • Gözlemlenbilirlik veya günlük oluşturma araçlarıyla tanışma

Hedef Kitle

  • Kalite güvencesi mühendisleri
  • AI güvenilirlik mühendisleri
  • Ajan kalitesi ve performansı sorumlu geliştiriciler
 21 Saatler

Katılımcı Sayısı


Katılımcı başına fiyat

Yaklaşan Etkinlikler

İlgili Kategoriler