Pratik Bir Giriş Stream Processing Eğitimi
Stream Processing, "hareket halindeki verilerin" gerçek zamanlı işlenmesini, yani veriler alındıkça üzerinde işlem yapılmasını ifade eder. Bu tür veriler, sensör olayları, web sitesi kullanıcı etkinliği, finansal işlemler, kredi kartı geçişleri, tıklama akışları vb. gibi veri kaynaklarından sürekli akışlar halinde okunur. Stream Processing çerçeveleri, gelen büyük hacimli verileri okuyabilir ve neredeyse anında değerli bilgiler sağlayabilir.
Bu eğitmen liderliğindeki, canlı eğitimde (yerinde veya uzaktan), katılımcılar farklı Stream Processing çerçevelerini mevcut büyük veri depolama sistemleri ve ilgili yazılım uygulamaları ve mikro hizmetlerle nasıl kuracaklarını ve entegre edeceklerini öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Farklı Stream Processing çerçevelerini, örneğin Spark Streaming ve Kafka Streaming'i kurmak ve yapılandırmak.
- İş için en uygun çerçeveyi anlamak ve seçmek.
- Verileri sürekli, eş zamanlı ve kayıt bazında işlemek.
- Stream Processing çözümlerini mevcut veritabanları, veri ambarları, veri gölleri vb. ile entegre etmek.
- Kurumsal uygulamalar ve mikro hizmetlerle en uygun akış işleme kütüphanesini entegre etmek.
Hedef Kitle
- Geliştiriciler
- Yazılım mimarları
Kurs Formatı
- Kısmen ders anlatımı, kısmen tartışma, egzersizler ve yoğun uygulamalı çalışma
Notlar
- Bu kurs için özelleştirilmiş bir eğitim talep etmek için lütfen bizimle iletişime geçin.
Eğitim İçeriği
Giriş
- Akış işleme ve toplu işleme
- Analitik odaklı akış işleme
Çerçevelere Genel Bakış ve Programming Languages
- Spark Streaming (Scala)
- Kafka Akışı (Java)
- Flink
- Storm
- Her Çerçevenin Özellik ve Güçlü Yönlerinin Karşılaştırılması
Veri Kaynaklarına Genel Bakış
- Zaman içindeki bir dizi olay olarak canlı veri
- Tarihi veri kaynakları
Dağıtım Seçenekleri
- Bulutta (AWS, vb.)
- Yerinde (özel bulut, vb.)
Başlarken
- Geliştirme Ortamının Kurulması
- Kurulum ve Yapılandırma
- Data Analysis İhtiyaçlarınızı Değerlendirme
Bir Akış Çerçevesini İşletme
- Akış Çerçevesini Big Data Araçlarla Entegre Etme
- Olay Stream Processing (ESP) ve Karmaşık Olay İşleme (CEP)
- Giriş Verilerini Dönüştürme
- Çıkış Verilerini İnceleme
- Stream Processing Çerçevesini Mevcut Uygulamalar ve Microservices ile Entegre Etme
Sorun Giderme
Özet ve Sonuç
Kurs İçin Gerekli Önbilgiler
- Herhangi bir dilde Programming deneyim
- Big Data kavramlarına (Hadoop, vb.) dair anlayış
Açık Eğitim Kursları 5 ve üzeri katılımcı gerektirir.
Pratik Bir Giriş Stream Processing Eğitimi - Booking
Pratik Bir Giriş Stream Processing Eğitimi - Enquiry
Pratik Bir Giriş Stream Processing - Danışmanlık Talebi
Danışmanlık Talebi
Danışanlarımızın Yorumları (1)
Yeterli uygulamaya imkan, eğitmen bilgili
Chris Tan
Eğitim - A Practical Introduction to Stream Processing
Yapay Zeka Çevirisi
Yaklaşan Etkinlikler
İlgili Kurslar
Confluent Apache Kafka Yönetimi
21 SaatConfluent Apache Kafka, yüksek hacimli, hata toleransı olan veri akışlarını ve gerçek zamanlı analitikleri tasarlanmış bir dağıtılmış olay akışı platformudur.
Bu eğitmen öncülive eğitim (çevrimiçi veya yerel), Confluent Apache Kafka kümelerini kurma, yapılandırma, izleme ve sorun gidermeye yönelik orta düzeyli sistem yöneticileri ve DevOps profesyonellerine yöneliktir.
Eğitim sonunda katılımcılar şunları yapabileceklerdir:
- Confluent Kafka'nın bileşenlerini ve mimarisini anlayacaklar.
- Kafka broker'larını, Zookeeper quorumlarını ve ana hizmetleri dağıtmayı ve yönetmeyi öğrenecekler.
- Güvenlik, kopyalama ve performans ayarlaması gibi gelişmiş özellikleri yapılandırabilecekler.
- Yönetim araçlarını kullanarak Kafka kümelerini izlemeyi ve bakımı yapabilecekler.
Eğitim Formatı
- Tartışmalı ders anlatımı.
- Farklı alıştırmalar ve uygulamalar.
- Canlı laboratuvar ortamında uygulama.
Eğitim Özelleştirme Seçenekleri
- Bu eğitim için özel bir eğitimin talep etmek isterseniz, bizimle iletişime geçerek düzenleme yapabilirsiniz.
Yapay Zeka - en çok uygulanan şeyler - Data Analysis + Dağıtık Yapay Zeka + Doğal Dil İşleme
21 SaatBu kurs, uygulamalarında yapay zekayı anlamak ve uygulamak isteyen geliştiricilere ve veri bilimcilerine yöneliktir. Özellikle veri analizi, dağıtık yapay zeka ve doğal dil işleme konularına odaklanmaktadır.
Birleşik Toplu İşlem ve Stream Processing ile Apache Beam
14 SaatApache Beam, paralel veri işleme hatlarını tanımlamak ve yürütmek için birleşik bir programlama modelidir. Gücü, hem toplu hem de akış hatlarını çalıştırabilme yeteneğinde yatar; yürütme, Beam'in desteklediği dağıtılmış işleme arka uçlarından biri tarafından gerçekleştirilir: Apache Apex, Apache Flink, Apache Spark ve Google Cloud Dataflow. Apache Beam, verileri farklı depolama ortamları ve veri kaynakları arasında taşımak, verileri daha arzu edilen bir formata dönüştürmek ve verileri yeni bir sisteme yüklemek gibi ETL (Çıkar, Dönüştür ve Yükle) görevleri için kullanışlıdır.
Bu eğitmen liderliğindeki, canlı eğitimde (yerinde veya uzaktan), katılımcılar, büyük bir veri kümesini bağımsız, paralel işleme için daha küçük parçalara ayıracak bir veri işleme hattı tanımlayan bir Java veya Python uygulamasında Apache Beam SDK'larını nasıl uygulayacaklarını öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Apache Beam'ü kurmak ve yapılandırmak.
- Tek bir programlama modeli kullanarak Java veya Python uygulamaları içinden hem toplu hem de akış işleme gerçekleştirmek.
- Hattı birden fazla ortamda yürütmek.
Kurs Formatı
- Kısmen ders anlatımı, kısmen tartışma, egzersizler ve yoğun uygulamalı çalışma
Not
- Bu kurs gelecekte Scala olarak sunulacaktır. Lütfen düzenlemek için bizimle iletişime geçin.
Building Kafka Solutions with Confluent
14 SaatBu eğitmen liderliğindeki, canlı eğitim (çevrimiçi veya yerinde), uygulamaları için gerçek zamanlı veri işleme platformu oluşturmak ve yönetmek için Confluent'i (Kafka'nın bir dağıtımı) kullanmak isteyen mühendislere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Confluent Platform'u kurma ve yapılandırma.
- Kafka'yı daha kolay çalıştırmak için Confluent yönetim araçlarını ve hizmetlerini kullanma.
- Gelen akış verilerinin depolanması ve işleme.
- Kafka kümelerinin optimize edilmesi ve yönetimi.
- Veri akışlarının güvenliği.
Kurs Formatı
- Etkileşimli ders anlatımı ve tartışma.
- Birçok alıştırma ve uygulama.
- Canlı-lab ortamında el ile uygulama.
Kurs Özelleştirme Seçenekleri
- Bu kurs, Confluent'in açık kaynak sürümüne dayanmaktadır: Confluent Open Source.
- Bu kurs için özel bir eğitim talep etmek istiyorsanız, lütfen bize ulaşarak düzenleme yapın.
Apache Flink Temel Bilgiler
28 SaatBu eğitmen liderliğindeki, canlı eğitimde Türkiye (çevrimiçi veya yerinde), dağıtılmış akış ve toplu veri işleme prensipleri ve yaklaşımları tanıtılır ve katılımcılar Apache Flink içinde gerçek zamanlı, veri akışı uygulaması oluşturma konusunda yönlendirilir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Veri analizi uygulamaları geliştirmek için bir ortam kurmak.
- Apache Flink'nin grafik işleme kütüphanesi (Gelly) nasıl çalıştığını anlamak.
- Hata toleranslı, Flink tabanlı, veri akışı uygulamalarını paketlemek, çalıştırmak ve izlemek.
- Çeşitli iş yüklerini yönetmek.
- Gelişmiş analizler yapmak.
- Çok düğümlü bir Flink kümesi kurmak.
- Performansı ölçmek ve optimize etmek.
- Flink'i farklı Big Data sistemleriyle entegre etmek.
- Flink yeteneklerini diğer büyük veri işleme çerçevelerinin yetenekleriyle karşılaştırmak.
Giriş Graph Computing
28 SaatBu eğitmen liderliğindeki canlı eğitimde, katılımcılar grafik verileri işleme teknolojilerini ve uygulama yaklaşımlarını Türkiye bölgesinde öğreneceklerdir. Amaç, gerçek dünyadaki nesneleri, özelliklerini ve ilişkilerini belirlemek, ardından bu ilişkileri modellemek ve Graph Computing (aynı zamanda Grafik Analitiği olarak da bilinir) yaklaşımını kullanarak bunları veri olarak işlemektir. Geniş bir genel bakışla başlayıp bir dizi vaka çalışması, uygulamalı alıştırma ve canlı dağıtım aracılığıyla belirli araçlara odaklanacağız.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Grafik verilerin nasıl kalıcı hale getirildiğini ve gezildiğini anlayabilmek.
- Belirli bir görev için en iyi çerçeveyi seçebilmek (grafik veritabanlarından toplu işleme çerçevelerine kadar).
- Hadoop, Spark, GraphX ve Pregel'i birçok makinede paralel olarak grafik hesaplaması yapmak için uygulayabilmek.
- Gerçek dünya büyük veri sorunlarını grafikler, süreçler ve geçişler açısından görebilmek.
Apache Kafka Programcılar için Python
7 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), veri mühendisleri, veri bilimcileri ve Python ile veri akışında Apache Kafka özelliklerini kullanmak isteyen programcılar için tasarlanmıştır.
Bu eğitimin sonunda katılımcılar, Python programlamayı kullanarak sürekli veri akışlarındaki koşulları izlemek ve yönetmek için Apache Kafka'ü kullanabilecektir.
Kafka Streams ile Stream Processing
7 SaatKafka Streams, bir Kafka mesajlaşma sistemine veri aktaran ve bu sistemden veri alan uygulamalar ve mikro hizmetler oluşturmak için kullanılan bir istemci tarafı kütüphanesidir. Geleneksel olarak, Apache Kafka, mesaj üreticileri ve tüketicileri arasında verileri işlemek için Apache Spark veya Apache Storm'a güveniyordu. Bir uygulamadan Kafka Streams API'si çağrılarak, veriler doğrudan Kafka içinde işlenebilir ve verileri ayrı bir kümeye gönderme ihtiyacı ortadan kalkar.
Bu eğitmen liderliğindeki, canlı eğitimde katılımcılar, akış işleme için Apache Kafka'e veri aktaran ve bu sistemden veri alan bir dizi örnek Java uygulamasına Kafka Streams'i nasıl entegre edeceklerini öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Kafka Streams'in diğer akış işleme çatılarına göre özellikleri ve avantajlarını anlamak
- Veri akışını doğrudan bir Kafka kümesinde işlemek
- Kafka ve Kafka Streams ile entegre olan bir Java veya Scala uygulaması veya mikro hizmeti yazmak
- Girdi Kafka konularını çıktı Kafka konularına dönüştüren net kod yazmak
- Uygulamayı oluşturup paketlemek ve dağıtmak
Hedef Kitle
- Geliştiriciler
Eğitim Formatı
- Sözlü ders, tartışmalar, alıştırmalar ve yoğun uygulamalı çalışmalardan oluşan bir karışım
Notlar
- Bu kurs için özel bir eğitim talep etmek istiyorsanız lütfen bizimle iletişime geçin ve düzenleme yapın.
Confluent KSQL
7 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), kod yazmadan Apache Kafka akış işlemeyi uygulamak isteyen geliştiricilere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Confluent KSQL'i kurmak ve yapılandırmak.
- Yalnızca SQL komutlarını kullanarak bir akış işleme hattı kurmak (ne Java ne de Python kodlama).
- Veri filtreleme, dönüştürme, toplama, birleştirme, pencereleme ve oturumlaştırma işlemlerini tamamen SQL içinde gerçekleştirmek.
- Akış ETL ve gerçek zamanlı analiz için etkileşimli, sürekli sorgular tasarlamak ve dağıtmak.
Apache NiFi Yöneticiler için
21 SaatBu eğitmen liderliğindeki, canlı eğitimde (Türkiye yerinde veya uzaktan), katılımcılar Apache NiFi'ü canlı bir laboratuvar ortamında nasıl dağıtacaklarını ve yöneteceklerini öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Apachi NiFi'yi kurun ve yapılandırın.
- Veritabanları ve büyük veri gölleri de dahil olmak üzere farklı, dağıtılmış veri kaynaklarından veri alın, dönüştürün ve yönetin.
- Veri akışlarını otomatikleştirin.
- Akış analitiğini etkinleştirin.
- Veri alımı için çeşitli yaklaşımlar uygulayın.
- Big Data ve verilerini iş içgörülerini dönüştürün.
Apache NiFi Geliştiriciler İçin
7 SaatBu eğitmen liderliğindeki canlı eğitimde Türkiye'da, katılımcılar Apache NiFi kullanarak bir dizi demo uzantısı, bileşen ve işlemci geliştirirken akış tabanlı programlamanın temellerini öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- NiFi'nin mimarisini ve veri akışı kavramlarını anlayabilecektir.
- NiFi ve üçüncü taraf API'lerini kullanarak uzantılar geliştirebilecektir.
- Kendi Apache Nifi işlemcilerini özel olarak geliştirebilecektir.
- Çeşitli ve alışılmadık dosya formatlarından ve veri kaynaklarından gerçek zamanlı verileri alıp işleyebilecektir.
Python ve Spark Big Data için (PySpark)
21 SaatBu eğitmen liderliğindeki, canlı eğitimde Türkiye, katılımcılar büyük verileri analiz etmek için Python ve Spark'ı birlikte nasıl kullanacaklarını uygulamalı egzersizler yaparak öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Python ile Spark'ı kullanarak Big Data analiz etmeyi öğreneceklerdir.
- Gerçek dünya senaryolarını taklit eden egzersizler üzerinde çalışacaklardır.
- PySpark kullanarak büyük veri analizi için farklı araç ve teknikleri kullanacaklardır.
Spark Streaming ile Python ve Kafka
7 SaatBu eğitmen liderliğindeki, canlı eğitim (online veya yerinde), gerçek zamanlı verileri işleme ve analiz etmede Spark Streaming özelliklerini kullanmak isteyen veri mühendisleri, veri bilimcileri ve programcılar için tasarlanmıştır.
Bu eğitimin sonunda katılımcılar, veritabanlarında, dosya sistemlerinde ve canlı gösterge panolarında kullanılmak üzere canlı veri akışlarını işlemek için Spark Streaming'yi kullanabilecektir.
Apache Spark MLlib
35 SaatMLlib, Spark’ın makine öğrenimi (ML) kütüphanesidir. Amacı, pratik makine öğrenimini ölçeklenebilir ve kolay hale getirmektir. Sınıflandırma, regresyon, kümeleme, işbirlikçi filtreleme, boyut azaltma gibi yaygın öğrenme algoritmaları ve yardımcı programlarının yanı sıra daha düşük seviyeli optimizasyon öncülleri ve daha yüksek seviyeli pipeline API’lerinden oluşur.
İki pakete ayrılır:
-
spark.mllib, RDD’ler üzerine inşa edilmiş orijinal API’yi içerir.
-
spark.ml, ML pipeline’ları oluşturmak için DataFrames üzerine inşa edilmiş daha yüksek seviyeli bir API sağlar.
Hedef Kitle
Bu kurs, Apache Spark için yerleşik bir Makine Öğrenimi Kütüphanesini kullanmak isteyen mühendisler ve geliştiricilere yöneliktir.
Stratio: Rocket ve Intelijans Modülleri ile PySpark
14 SaatStratio, büyük veri, yapay zeka ve yönetimini tek bir çözümde entegre eden bir veri odaklı platformdur. Rocket ve Intelligence modülleri, işletmelerde hızlı veri keşfi, dönüştürme ve ileri analizler sağlar.
Bu eğitmen yönetimi altında yapılan canlı eğitim (çevrimiçi veya yerel) orta seviye veri profesyonellerine yönelik olup, Stratio'daki Rocket ve Intelligence modüllerini etkili bir şekilde kullanmayı amaçlar. Eğitim PySpark konusunda döngü yapısı, kullanıcı tanımlı fonksiyonlar ve ileri düzey veri mantığına odaklanır.
Bu eğitim sonunda katılımcılar şunları başarabilecekler:
- Stratio platformunda Rocket ve Intelligence modüllerini kullanarak gezinme ve çalışma.
- Veri alımı, dönüştürme ve analiz bağlamında PySpark'yi uygulama.
- Döngüler ve koşullu mantığı kullanarak veri akışlarını ve özellik mühendisliği görevlerini kontrol etme.
- PySpark'da yeniden kullanılabilir veri işlemlerine yönelik kullanıcı tanımlı fonksiyonlar (UDF) oluşturma ve yönetme.
Eğitim Formatı
- Etkileşimli ders anlatımı ve tartışma.
- Çok sayıda alıştırma ve uygulama.
- Canlı laboratuvar ortamında el ile uygulama.
Eğitim özelleştirme seçenekleri
- Bu eğitim için özel bir eğitim talep etmek isterseniz, bizimle iletişime geçerek düzenleme yapabilirsiniz.