Eğitim İçeriği

Giriş:

  • Apache Spark Hadoop Ekosisteminde
  • Python ve Scala için kısa bir giriş

Temeller (teori):

  • Mimari
  • RDD
  • Dönüşümler ve Eylemler
  • Aşama, Görev, Bağımlılıklar

Databricks ortamını kullanarak temelleri anlama (uygulama çalışması):

  • RDD API'sini kullanarak egzersizler
  • Temel dönüşüm ve eylem fonksiyonları
  • PairRDD
  • Join
  • Önbellekleme stratejileri
  • DataFrame API'sini kullanarak egzersizler
  • SparkSQL
  • DataFrame: seç, filtrele, grupla, sırala
  • UDF (Kullanıcı Tanımlı Fonksiyon)
  • DataSet API'sine bakış
  • Streaming

AWS ortamını kullanarak dağıtımı anlama (uygulama çalışması):

  • AWS Glue'nun temelleri
  • AWS EMR ve AWS Glue arasındaki farkları anlama
  • Her iki ortamda örnek işler
  • Artıları ve eksileri anlama

Ekstra:

  • Apache Airflow düzenlemesine giriş

Kurs İçin Gerekli Önbilgiler

Programlama becerileri (tercihen Python, Scala)

SQL temelleri

 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Danışanlarımızın Yorumları (3)

Yaklaşan Etkinlikler

İlgili Kategoriler