Eğitim İçeriği

Gemini 3 Çok Modluluğuna Giriş

  • Metin, görüntü, ses ve video üzerindeki yetenekler
  • Model seçim ve uç nokta genel bakış
  • Çok modlu mantıksal işlemde anahtar kavramlar

Metin ve Yapılandırılmış Girdilerle Çalışma

  • Metin oluşturma için istem stratejileri
  • Meta veriler, bağlam pencereleri ve gömülme
  • Çok modlu görevlerin metin tabanlı yönetimi

Görüntü Anlayışı ve Görsel İş Akışları

  • Gemini 3 ile görüntü analizi ve yorumlaması
  • Görsel arama ve etiketleme araçlarının oluşturulması
  • Görüntüden metne ve metinden görselleştirmeye etkileşimlerin oluşturulması

Ses Girdisi İşleme

  • Konuşma tanıma ve transkripsiyon iş akışları
  • Ses olayı tespiti ve yorumlaması
  • Metin ve görsel girdilerle ses entegrasyonu

Video Zekası ve Sahne Analizi

  • Kare kare ve sürekli video mantıksal işlemi
  • Özetleme ve vurgu çıkarma araçlarının oluşturulması
  • Video tabanlı otomasyon ve içerik iş akışları

Çok Modlu Uygulama Mimarisini Tasarlama

  • Tek bir akışta birden fazla girdi türünün birleştirilmesi
  • Gecikme, maliyet ve hesaplama dikkate alınması
  • Ölçeklenebilir çok modlu sistemler için en iyi uygulamalar

Çok Modlu Uygulamaların Prototiplerini Oluşturma

  • Çok modlu prototiplerin elden geçirilmesi
  • İsteme mühendisliği ile hızlı iterasyon
  • Kullanıcı deneyimi akışlarının test edilmesi ve iyileştirilmesi

Çok Modlu Çözümlerinin Dağıtılması

  • Dağıtım stratejileri ve ortam kurulumu
  • Gerçek dünya performansının izlenmesi
  • Güvenlik ve uyumluluk dikkate alınması

Özeti ve Sonraki Adımlar

Kurs İçin Gerekli Önbilgiler

  • Modern AI kavramları hakkında bir anlayış
  • Python veya JavaScript deneyimi
  • REST API'lerle aşina olma

Hedef Kitle

  • Tasarımcılar
  • İçerik yaratıcıları
  • Teknik ürün ekipleri
 14 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Danışanlarımızın Yorumları (1)

Yaklaşan Etkinlikler

İlgili Kategoriler