Eğitim İçeriği

Multimodal AI ve Ollama'ya Giriş

  • Multimodal öğrenmenin özeti
  • Görüş-dil entegrasyonundaki temel zorluklar
  • Ollama'nın özelliklerini ve mimarisini keşfetme

Ollama Ortamını Kurma

  • Ollama'yı kurma ve yapılandırma
  • Yerel model dağıtımı ile çalışmak
  • Ollama'yı Python ve Jupyter ile entegre etme

Multimodal Girdilerle Çalışma

  • Metin ve görüntü entegrasyonu
  • Ses ve yapılandırılmış veriyi dahil etme
  • Ön işleme borularını tasarlamak

Döküman Anlama Uygulamaları

  • PDF'lerden ve görüntülerden yapılandırılmış bilgi çıkarmak
  • OCR ile dil modellerini birleştirme
  • Zeki döküman analiz akışlarını oluşturma

Görsel Soru Cevaplama (VQA)

  • VQA veri kümeleri ve referans noktalarını kurma
  • Multimodal modellerin eğitimi ve değerlendirmesi
  • Interaktif VQA uygulamaları oluşturma

Multimodal Ajentler Oluşturma

  • Birçok moda uyumlu düşünme ile ajent tasarımı ilkeleri
  • Kestirim, dil ve eylemi birleştirme
  • Ajentleri gerçek dünya kullanım durumları için dağıtım

İleri Entegrasyon ve Optimizasyon

  • Ollama ile multimodal modelleri fine-tuning etme
  • Tahmin performansını iyileştirme
  • Skalabilite ve dağıtım kriterleri

Özet ve Sonraki Adımlar

Kurs İçin Gerekli Önbilgiler

  • Makine öğrenimi kavramları üzerine güçlü bilgi
  • PyTorch veya TensorFlow gibi derin öğrenme çerçevelerinde deneyim
  • Natural Language Processing (Yanıtlama Dili İşleme) ve Bilgisayar Görsel işleme konularında uzmanlık

Hedef Kitle

  • Makine öğrenimi mühendisleri
  • Yapay zeka araştırmacıları
  • Görünümleri ve metin akışlarını entegre eden ürün geliştiricileri
 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Yaklaşan Etkinlikler

İlgili Kategoriler