Eğitim İçeriği

  • Giriş
    • Hadoop tarihi, kavramlar
    • Ekosistem
    • Dağıtımlar
    • Yüksek seviye mimari
    • Hadoop efsaneleri
    • Hadoop zorlukları (donanım / yazılım)
    • Laboratuvar: Büyük Veri projeleriniz ve sorunlarınıza ilişkin tartışma
  • Planlama ve Kurulum
    • Yazılım seçimleri, Hadoop dağıtımları
    • Kümenin boyutunu belirleme, büyüme için planlama
    • Donanım ve ağ seçimleri
    • Rafa topolojisi
    • Kurulum
    • Çok kiracılılık
    • Dizin yapısı, günlükler
    • Performans ölçümü
    • Laboratuvar: küme kurulumu, performans ölçümleri çalıştırma
  • HDFS İşlemleri
    • Kavramlar (yatay ölçeklendirme, kopyalama, veri yerelliği, rafa farkındalık)
    • Düğümler ve hizmetler (NameNode, Secondary NameNode, HA Standby NameNode, DataNode)
    • Sağlık izlemesi
    • Komut satırı ve tarayıcı tabanlı yönetim
    • Depolama ekleme, arızalı sürücülerin değiştirilmesi
    • Laboratuvar: HDFS komut satırları ile tanışma
  • Veri Yükleme
    • Flume kullanarak günlükler ve diğer verilerin HDFS'e yükleneceği
    • SQL veritabanlarından HDFS'e aktarım ve geri SQL'e aktarma için Sqoop
    • Hive ile Hadoop Veri Ambarı
    • Kümeler arasında veri kopyalama (distcp)
    • S3'ü HDFS'in tamamlayıcısı olarak kullanma
    • Veri yükleme en iyi uygulamaları ve mimarileri
    • Laboratuvar: Flume'ın kurulumu ve kullanımı, Sqoop için de aynı şekilde
  • MapReduce İşlemleri ve Yönetimi
    • MapReduce öncesi paralel bilgi işlem: HPC ile Hadoop yönetimi karşılaştırması
    • MapReduce küme yükleri
    • Düğümler ve hizmetler (JobTracker, TaskTracker)
    • MapReduce UI gezi
    • MapReduce yapılandırması
    • Job yapılandırma
    • MapReduce'ü optimize etme
    • MR'in güvenilir hale getirilmesi: programcılarına ne söyleyeceksiniz
    • Laboratuvar: MapReduce örnekleri çalıştırma
  • YARN: yeni mimari ve yetenekler
    • YARN tasarım hedefleri ve uygulama mimarisi
    • Yeni aktörler: ResourceManager, NodeManager, Application Master
    • YARN'ın kurulumu
    • YARN altında iş planlaması
    • Laboratuvar: iş planlamasını inceleme
  • İleri Konular
    • Donanım izlemesi
    • Küme izlemesi
    • Sunucuların eklenmesi ve çıkarılması, Hadoop'un güncellenmesi
    • Yedekleme, kurtarma ve iş sürekliliği planlaması
    • Oozie iş akışları
    • Hadoop yüksek kullanılabilirliği (HA)
    • Hadoop Federasyonu
    • Kümenizi Kerberos ile güvenli hale getirme
    • Laboratuvar: izleme kurulumu
  • Opsiyonel Takipler
    • Cloudera Manager ile küme yönetimi, izleme ve rutin görevler; kurulum, kullanım. Bu takipde, tüm alıştırmalar ve laboratuvarlar Cloudera dağıtım ortamında (CDH5) gerçekleştirilir.
    • Ambari ile küme yönetimi, izleme ve rutin görevler; kurulum, kullanım. Bu takipde, tüm alıştırmalar ve laboratuvarlar Ambari küme yöneticisi ve Hortonworks Data Platform (HDP 2.0) ortamında gerçekleştirilir.

Kurs İçin Gerekli Önbilgiler

  • Temel Linux sistem yönetimiyle rahat hissediyor olmak
  • Temel betik yazma becerileri

Hadoop ve Dağıtık Bilgi İşlem bilgisi gereklidir, ancak kursta tanıtılan ve açıklanan konular olacaktır.

Laboratuvar Ortamı

Sıfır Kurulum : Öğrencilerin makinalarına Hadoop yazılımını kurma ihtiyacı yoktur! Öğrencilere çalışan bir Hadoop kümeleri sağlanacaktır.

Öğrenciler aşağıdaki gereklilikleri sağlayacaklar

  • Bir SSH istemcisi (Linux ve Mac zaten ssh istemcisi ile gelir, Windows için Putty önerilir)
  • Kümeye erişmek için bir tarayıcı. Firefox tarayıcısı ile FoxyProxy eklentisinin kurulu olması önerilir.
 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Danışanlarımızın Yorumları (5)

Yaklaşan Etkinlikler

İlgili Kategoriler