Eğitim İçeriği

Bölüm 1: HDFS'deki Veri Yönetimi

  • Farklı Veri Formatları (JSON / Avro / Parquet)
  • Sıkıştırma Şemaları
  • Veri Maskeleme
  • Laboratuvarlar : farklı veri formatlarını analiz etmek; sıkıştırmayı etkinleştirmek

Bölüm 2: Gelişmiş Pig

  • Kullanıcı Tarafından Tanımlanmış Fonksiyonlar
  • Pig Kütüphanelerine Giriş (ElephantBird / Data-Fu)
  • Complex Yapısal Verileri Pig ile Yükleme
  • Pig Tuning
  • Laboratuvarlar : gelişmiş pig scripting, karma veri türlerini ayrıştırma

Bölüm 3: Gelişmiş Hive

  • Kullanıcı Tarafından Tanımlanmış Fonksiyonlar
  • Sıkıştırılmış Tablolar
  • Hive Performans Tuning
  • Laboratuvarlar : sıkıştırılmış tablolar oluşturma, tablo formatları ve yapılandırmayı değerlendirme

Bölüm 4: Gelişmiş HBase

  • Gelişmiş Şema Modellemesi
  • Sıkıştırma
  • Toplu Veri Yükleme
  • Wide-table / Tall-table Karşılaştırması
  • HBase ve Pig
  • HBase ve Hive
  • HBase Performans Tuning
  • Laboratuvarlar : HBase tuning; HBase verisine Pig & Hive ile erişim; Veri modellemesi için Phoenix kullanımı

Kurs İçin Gerekli Önbilgiler

  • Java programlama diline aşina olmak (çoğu programlama alıştırması Java'da)
  • Linux ortamına aşın olmak (Linux komut satırında gezinmek, dosyaları vi / nano kullanarak düzenlemek)
  • Hadoop hakkında iş bilgisi.

Laboratuvar Ortamı

Sıfır Kurulum: Öğrencilerin makinelerine hadoop yazılımını kurma gerekliliği yoktur! Öğrencilere bir çalışan Hadoop kümeleri sağlanacaktır.

Öğrencilerin şunları gerektireceğini unutmayın

 21 Saat

Katılımcı Sayısı


Katılımca başına fiyat

Danışanlarımızın Yorumları (5)

Yaklaşan Etkinlikler

İlgili Kategoriler