Eğitim İçeriği

Bölüm 1: Data Management içinde HDFS

  • Farklı Veri Biçimleri (JSON / Avro / Parquet)
  • Sıkıştırma Şemaları
  • Veri Maskeleme
  • Laboratuvarlar: Farklı veri biçimlerinin analiz edilmesi; sıkıştırmayı etkinleştirme

Bölüm 2: Gelişmiş Pig

  • Kullanıcı Tanımlı Fonksiyonlar
  • ElephantBird / Data-Fu gibi Pig Kütüphanelerine Giriş
  • Pig ile Karmaşık Yapılandırılmış Veri Yükleme
  • Pig Ayarlama
  • Laboratuvarlar: gelişmiş Pig betikleri, karmaşık veri tiplerini ayrıştırma

Bölüm 3 : Gelişmiş Hive

  • Kullanıcı Tanımlı Fonksiyonlar
  • Sıkıştırılmış Tablolar
  • Hive Performans Ayarlama
  • Laboratuvarlar: sıkıştırılmış tablo oluşturma, tablo biçimlerini ve yapılandırmayı değerlendirme

Bölüm 4 : Gelişmiş HBase

  • Gelişmiş Şema Tasarımı
  • Sıkıştırma
  • Toplu Veri Girişi
  • Kalın Tablo / Uzun Tablo Karşılaştırması
  • HBase ve Pig
  • HBase ve Hive
  • HBase Performans Ayarlama
  • Laboratuvarlar: HBase ayarlama; Pig ve Hive üzerinden HBase verilerine erişim; Phoenix kullanarak veri modelleme

Kurs İçin Gerekli Önbilgiler

  • Java programlama dilinde rahatlıkla çalışabilme yeteneği (çoğu programlama egzersizleri Java'da yapılmaktadır)
  • Linux ortamında rahatlıkla çalışabilme yeteneği (komut satırını kullanma, vi / nano ile dosya düzenleme gibi işlemlerin yapılması gerekmektedir)
  • Hadoop'nin çalışma bilgisine sahip olunması.

Laboratuvar Ortamı

Sifır Kurulum: Öğrencilerin makinelere hadoop yazılımını kurmalarına gerek yok! Öğrenciler için çalışan bir hadoop klüteri sağlanacaktır.

Öğrencilerin aşağıdaki gerekliliklere sahip olması gerekmektedir

 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Danışanlarımızın Yorumları (5)

Yaklaşan Etkinlikler

İlgili Kategoriler