Talend Büyük Veri Entegrasyonu Eğitimi
Talend Open Studio for Big Data, büyük verilerin işlenmesi için açık kaynak kodlu bir ETL aracıdır. Büyük Veri kaynaklarına ve hedeflere etkileşim kurmayı ve kod yazmadan işleri çalıştırmayı sağlayan bir geliştirme ortamı içerir.
Bu eğitmen yönlendirilmiş, canlı eğitim (çevrimiçi veya yerinde) teknik kişilerin Talend Open Studio for Big Data'yı kullanarak Büyük Verilerin okunması ve işlenmesi sürecini basitleştirmesini amaçlamaktadır.
Bu eğitim sonunda katılımcılar şunları yapabilecekler:
- Talend Open Studio for Big Data'yı yükleyip yapılandırabilirler.
- Cloudera, HortonWorks, MapR, Amazon EMR ve Apache gibi Büyük Veri sistemleriyle bağlantı kurabilirler.
- Open Studio'nun Büyük Veri bileşenlerini ve bağlayıcılarını anlayıp kurabilirler.
- MapReduce kodu otomatik olarak üretilmesi için parametreleri yapılandırabilirler.
- Open Studio'nun sürükleyip bırakma arayüzünü kullanarak Hadoop işleri çalıştırabilirler.
- Büyük Veri hattı taslakları oluşturabilirler.
- Büyük Veri entegrasyon projelerini otomatikleştirebilirler.
Eğitim Biçimi
- Etkileşimli ders ve tartışma.
- Birçok alıştırma ve uygulama.
- Canlı laboratuvar ortamında el ile uygulama.
Eğitim Özelleştirme Seçenekleri
- Bu eğitimin özelleştirilmiş bir sürümünü talep etmek için bizimle iletişime geçin.
Eğitim İçeriği
Giriş
"Open Studio for Big Data" Özellikleri ve Mimarisine Genel Bakış
Open Studio for Big Data'yı Kurma
Kullanıcı Arayüzünü Navigasyon
Büyük Veri Bileşenlerini ve Bağlayıcıları Anlama
Hadoop Kümesine Bağlanma
Veri Okuma ve Yazma
Hive ve MapReduce ile Veri İşleme
Sonuçları Analiz Etme
Büyük Verinin Kalitesini Geliştirme
Büyük Veri Hattı Oluşturma
Kullanıcılar, Gruplar, Roller ve Projeleri Yönetme
Open Studio'yı Üretim Ortamına Dağıtma
Open Studio'nun İzlenmesi
Sorun Giderme
Özet ve Sonuçlar
Kurs İçin Gerekli Önbilgiler
- İlişkisel veritabanları konusunda bilgi.
- Veri ambarı konusunda bilgi.
- ETL (Veri Çekme, Dönüşüm, Yükleme) kavramları konusunda bilgi.
Hedef Kitle
- İş zekası uzmanları
- Veritabanı uzmanları
- SQL Geliştiricileri
- ETL Geliştiricileri
- Çözüm mimarları
- Veri mimarları
- Veri ambarı uzmanları
- Sistem yöneticileri ve entegratörleri
Açık Eğitim Kursları 5 ve üzeri katılımcı gerektirir.
Talend Büyük Veri Entegrasyonu Eğitimi - Rezervasyon
Talend Büyük Veri Entegrasyonu Eğitimi - Talep Oluştur
Talend Büyük Veri Entegrasyonu - Danışmanlık Talebi
Danışanlarımızın Yorumları (1)
El ile işlemler. Sınıfın 5 gün olması gerekiyordu, ancak 3 gün bile zaten NiFi ile çalışmaktan kaynaklanan birçok sorumu aydınlatmaya yardımcı oldu.
James - BHG Financial
Eğitim - Apache NiFi for Administrators
Yapay Zeka Çevirisi
Yaklaşan Etkinlikler
İlgili Kurslar
Gelişmiş Apache Iceberg
21 SaatlerBu eğitmen yönlendirilmiş, canlı eğitim Türkiye (çevrimiçi veya yerinde) gelişmiş düzeyde veri profesyonellerini hedeflemektedir. Eğitim, veri işleme iş akışlarını optimize etme, veri bütünlüğünü sağlama ve modern büyük veri uygulamalarının karmaşıklıklarını yönetebilen güçlü bir data lakehouse çözümü uygulama konularını ele alır.
Bu eğitim sonunda katılımcılar:
- Iceberg mimarisini, meta veri yönetimi ve dosya düzenlemesi dahil olmak üzere kapsamlı bir şekilde anlayacaklardır.
- Iceberg'ın çeşitli ortamlarda optimal performans için nasıl yapılandırılacağını ve birden fazla veri işleme motoruyla nasıl entegre edileceğini öğreneceklerdir.
- Büyük ölçekli Iceberg tablolarını yönetecek, karmaşık şema değişiklikleri gerçekleştirecek ve bölüm evrimi yönetimini ele alacaklardır.
- Büyük veri kümeleri için sorgu performansını ve veri tarama verimliliğini optimize etme tekniklerini öğreneceklerdir.
- Dağıtık ortamlarda veri tutarlılığını sağlamak, işlem garanti yönetimini uygulamak ve hataları yönetmek için mekanizmaları kullanacaklardır.
Apache Iceberg Temel Kavramlar
14 SaatlerBu eğitmen tarafından yönetilen canlı eğitim Türkiye (çevrimiçi veya yerel) başlangıç seviyesindeki veri uzmanlarına Apache Iceberg'ı etkili bir şekilde kullanarak büyük ölçekli veri kümelerini yönetmeyi, veri bütünlüğünü sağlamak ve veri işleme akışlarını optimize etmek için gerekli bilgi ve becerileri kazanma fırsatı sunmaktadır.
Bu eğitim sonunda katılımcılar şunları yapabilecektir:
- Apache Iceberg'ın mimarisi, özellikleri ve faydalarını tam olarak anlamış olacaklardır.
- Tablo formatları, bölüntulama, şema evrimi ve zaman yolculuğu yetenekleri hakkında bilgi edinmiş olacaklardır.
- Apache Iceberg'ı farklı ortamlarda kurma ve yapılandırma işlemlerini öğreneceklerdir.
- Iceberg tablolarını oluşturma, yönetme ve düzenleme işlemlerini gerçekleştirebilecektir.
- Diğer tablo formatlarından Iceberg'a veri geçiş sürecini anlayacaklardır.
Big Data Colab ve Apache Spark ile Analizler Google
14 SaatlerBu eğitmen yönetilen canlı eğitim (Türkiye çevrimiçi veya yerel) ortamında, büyük veri işleme ve analizi için Google Colab ve Apache Spark'yi kullanmak isteyen orta düzeyli veri bilimcileri ve mühendislerine yönelik olacak.
Bu eğitim sonunda katılımcılar aşağıdaki becerileri kazanabilecekler:
- Google Colab ve Spark kullanarak büyük veri ortamını kurma.
- Apache Spark ile büyük veri kümelerini etkili bir şekilde işlemek ve analiz etme.
- Kooperatif bir ortamda büyük veriyi görselleştirme.
- Apache Spark'yi bulut tabanlı araçlarla entegre etme.
Apache NiFi Yöneticiler için
21 SaatlerApache NiFi, açık kaynaklı, akış tabanlı veri entegrasyonu ve olay işleme platformudur. Farklı sistemler arasında otomatik, gerçek zamanlı veri yönlendirmesi, dönüştürmesi ve sistem aracılaması sağlar. Web tabanlı kullanıcı arayüzü ve detaylı kontrol imkanları sunar.
Bu eğitmen yönlendirilmiş, canlı eğitim (yerinde veya uzaktan), orta düzeydeki yöneticiler ve mühendisler için düzenlenmiştir. Bu kişilerin üretim ortamlarında NiFi veri akışlarını dağıtmayı, yönetmeyi, güvemli hale getirmeyi ve optimize etmeyi öğrenmek istiyor olabilir.
Bu eğitim sonunda katılımcılar şu becerilere sahip olacaklardır:
- Apache NiFi kümelerini kurma, yapılandırma ve bakım yapma.
- Farklı kaynaklardan ve havalardan veri akışları tasarlamayı ve yönetmeyi.
- Akış otomasyonunu, yönlendirmesini ve dönüştürme mantığını uygulama.
- Performansı optimize etme, işlemlerini izleme ve sorunları giderme.
Eğitim Formatı
- Günlük mimari tartışmalarını içeren etkileşimli ders.
- Akışları oluşturma, dağıtım ve yönetme konusunda elden deneyimler.
- Canlı-lab ortamında senaryo tabanlı alıştırmalar.
Eğitim Özelleştirme Seçenekleri
- Bu eğitimin özelleştirilmiş bir sürümünü talep etmek için lütfen bizimle iletişime geçin.
PySpark ve Makine Öğrenimi
21 SaatlerBu eğitim, PySpark kullanılarak ölçeklenebilir veri işleme ve Makine Öğrenimi iş akışlarının oluşturulmasına yönelik pratik bir giriş niteliğindedir. Katılımcılar, Apache Spark'ın modern Büyük Veri ekosistemleri içinde nasıl çalıştığını ve dağıtık hesaplama ilkelerini kullanarak büyük veri kümelerini nasıl verimli bir şekilde işleyebileceklerini öğrenir.
Apache Spark Temel Kavramları
21 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), çok büyük miktarda veriyi işlemek için Apache Spark sistemini kurmak ve dağıtmak isteyen mühendislere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Apache Spark'ü kurun ve yapılandırın.
- Çok büyük veri kümelerini hızlı bir şekilde işleyin ve analiz edin.
- Apache Spark ve Hadoop MapReduce arasındaki farkı anlayın ve hangisini ne zaman kullanacağınızı bilin.
- Apache Spark'ü diğer makine öğrenimi araçlarıyla entegre edin.
Apache Spark Yönetimine Giriş
35 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), Spark kümelerini dağıtmak, sürdürmek ve optimize etmek isteyen başlangıç seviyesi ile orta seviye sistem yöneticilerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Çeşitli ortamlarda Apache Spark'yi kurmak ve yapılandırmak.
- Küme kaynaklarını yönetmek ve Spark uygulamalarını izlemek.
- Spark kümelerinin performansını optimize etmek.
- Güvenlik önlemleri uygulamak ve yüksek kullanılabilirlik sağlamak.
- Yaygın Spark sorunlarını ayıklamak ve gidermek.
Apache Spark Bulutta
21 SaatlerApache Spark'nin öğrenme eğrisi başlangıçta yavaş yükselir ve ilk sonuçları elde etmek için çok çaba gerektirir. Bu kursun amacı, bu zorlu başlangıcı atlatmanıza yardımcı olmaktır. Bu kursu tamamlayan katılımcılar, Apache Spark'ün temellerini anlayacak, RDD ile DataFrame arasındaki farkı net bir şekilde ayırt edebilecek, Python ve Scala API'lerini öğrenecek, yürütücüler ve görevler hakkında bilgi sahibi olacaklardır. Ayrıca en iyi uygulamaları takip ederek, bu kurs bulut dağıtımı, Databricks ve AWS'ye güçlü bir şekilde odaklanmaktadır. Öğrenciler ayrıca AWS EMR ve AWS Glue arasındaki farkları, AWS'nin en son Spark hizmetlerinden birini anlayacaklardır.
HEDEF KİTLE:
Veri Mühendisi, DevOps, Veri Bilimcisi
Python ve Büyük Veri için Spark (PySpark)
21 SaatlerBu eğitmen liderliğindeki, canlı eğitimde Türkiye, katılımcılar büyük verileri analiz etmek için Python ve Spark'ı birlikte nasıl kullanacaklarını uygulamalı egzersizler yaparak öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Python ile Spark'ı kullanarak Big Data analiz etmeyi öğreneceklerdir.
- Gerçek dünya senaryolarını taklit eden egzersizler üzerinde çalışacaklardır.
- PySpark kullanarak büyük veri analizi için farklı araç ve teknikleri kullanacaklardır.
Python, Spark ve Hadoop için Büyük Veri
21 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), büyük ve karmaşık veri kümelerini işlemek, analiz etmek ve dönüştürmek için Spark, Hadoop ve Python'yı kullanmak ve entegre etmek isteyen geliştiricilere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Spark, Hadoop ve Python ile büyük veri işlemeye başlamak için gerekli ortamı kurmak.
- Spark ve Hadoop'in özelliklerini, temel bileşenlerini ve mimarisini anlamak.
- Büyük veri işleme için Spark, Hadoop ve Python'yı nasıl entegre edeceğini öğrenmek.
- Spark ekosistemindeki araçları (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka ve Flume) keşfetmek.
- Netflix, YouTube, Amazon, Spotify ve Google gibi işbirlikçi filtreleme öneri sistemleri oluşturmak.
- Apache Mahout'u kullanarak makine öğrenimi algoritmalarını ölçeklendirmek.
Stratio: Rocket ve Intelligence Modülleri ile PySpark
14 SaatlerStratio, büyük veri, yapay zeka ve yönetim alanlarını tek bir çözümde entegre eden, veri odaklı bir platformdur. Rocket ve Intelligence modüllerinin yardımıyla, kurumsal ortamlarda hızlı veri keşfi, dönüştürme ve gelişmiş analitik işlemler gerçekleştirilebilir.
Bu eğitmen rehberli canlı eğitim (çevrimiçi veya yerinde) PySpark'i döngü yapıları, kullanıcı tanımlı fonksiyonlar ve gelişmiş veri mantığı üzerinde odaklanarak Stratio'daki Rocket ve Intelligence modüllerini etkili şekilde kullanmayı öğrenmek isteyen orta seviye veri profesyonellerine yöneliktir.
Bu eğitimden sonra katılımcılar şunları yapabilecekler:
- Rocket ve Intelligence modüllerini kullanarak Stratio platformunda gezinme ve çalışma.
- Veri alımı, dönüştürme ve analiz bağlamında PySpark'ı uygulama.
- Veri iş akışlarını ve özellik mühendisliği görevlerini kontrol etmek için döngüler ve koşullu mantık kullanma.
- PySpark'ta tekrar kullanılabilir veri işlemleri için kullanıcı tanımlı fonksiyonlar (UDFs) oluşturma ve yönetme.
Eğitim Biçimi
- Etkileşimli ders ve tartışma.
- Birçok alıştırma ve uygulama.
- Canlı-lab ortamında el ile uygulama.
Eğitim Özelleştirme Seçenekleri
- Bu eğitimin özelleştirilmiş bir sürümünü talep etmek için lütfen bizimle iletişime geçin.
Talend Yönetim Merkezi (TAC)
14 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), kuruluşun rolleri ve görevlerini dağıtmak ve yönetmek için Talend Administration Center'ı kurmak isteyen sistem yöneticileri, veri bilimcileri ve iş analistlerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Talend Administration Center'ı kurmak ve yapılandırmak.
- Talend yönetim temellerini anlamak ve uygulamak.
- Talend içinde iş projeleri veya görevleri oluşturmak, dağıtmak ve çalıştırmak.
- Veri kümelerinin güvenliğini izlemek ve TAC çerçevesine dayalı iş rutinleri geliştirmek.
- Büyük veri uygulamalarına dair daha geniş bir anlayış kazanmak.
Talend Veri Bağımsızlığı
14 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), veri kalitesini yönetme ve iyileştirme konusunda becerilerini derinleştirmek isteyen başlangıç ve orta seviyedeki veri analistlerine yöneliktir. Talend Data Stewardship kullanılarak.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Veri kalitesini korumada veri yönetimi rolünü kapsamlı bir şekilde anlayın.
- Veri kalitesi görevlerini yönetmek için Talend Data Stewardship kullanın.
- Talend Data Stewardship içinde görevler oluşturun, atayın ve yönetin; iş akışı özelleştirmesi dahil.
- Veri kalitesini ve yönetim çabalarını izlemek için aracın raporlama ve izleme yeteneklerini kullanın.
Talend Open Studio for ESB
21 SaatlerIn this instructor-led, live training in Türkiye, participants will learn how to use Talend Open Studio for ESB to create, connect, mediate, and manage services and their interactions.
By the end of this training, participants will be able to
- Integrate, enhance, and deliver ESB technologies as unified packages across various deployment environments.
- Understand and leverage the most frequently used components of Talend Open Studio.
- Integrate any application, database, API, or web services.
- Seamlessly integrate heterogeneous systems and applications.
- Embed existing Java code libraries to extend project capabilities.
- Leverage community components and code to extend projects.
- Rapidly integrate systems, applications, and data sources within a drag-and-drop Eclipse environment.
- Reduce development time and maintenance costs by generating optimized, reusable code.