Veri Akışı ve Gerçek Zamanlı Veri İşleme Eğitimi
Kurs Genel Bakış
Bu kurs, gerçek zamanlı veri akış sistemleri kurma konusunda pratik ve yapılandırılmış bir giriş sağlar. Ölçeklenebilir veri akışlarını işlemek için temel kavramları, mimari desenleri ve endüstriyel araçları kapsar. Katılımcılar, modern çerçeveler kullanarak veri akış hatlarını nasıl tasarlayacaklarını, uygulayacaklarını ve optimize edeceklerini öğreneceklerdir. Kurs, temelleri uygulamaya bağlayarak, katılımcıların üretim ortamında kullanıma hazır gerçek zamanlı çözümleri güvenle geliştirmelerini hedefler.
Eğitim Formatı
• Eğitmen liderliğindeki oturumlar ve rehberli açıklamalar
• Gerçek dünya örnekleriyle kavramsal açıklamalar
• Uygulamalı gösterimler ve kodlama alıştırmaları
• Günlük konulara uygun kademeli laboratuvar uygulamaları
• Etkileşimli tartışmalar ve soru-cevap oturumları
Kurs Hedefleri
• Gerçek zamanlı veri akışı kavramlarını ve sistem mimarisini anlamak
• Toplu (batch) veri işleme ile akış (streaming) veri işleme modelleri arasındaki farkları ayırt etmek
• Ölçeklenebilir ve hata toleranslı veri akış hatları tasarlamak
• Dağıtık mesajlaşma araçları ve çerçeveleri ile çalışmak
• Olay zamanı (event time) işleme, pencereleme (windowing) ve durumlu işlemleri uygulamak
• İşletme gereksinimlerine yönelik gerçek zamanlı veri çözümlerini geliştirip optimize etmek
Eğitim İçeriği
Kurs İçeriği - Gün 1
• Veri akışı kavramlarına giriş
• Toplu (batch) ile gerçek zamanlı işlemenin temelleri
• Olay temelli mimarinin temelleri
• Endüstride yaygın kullanım alanları
• Akış ekosisteminin genel görünümü
Gün 2
• Akış mimarisi tasarım desenleri
• Dağıtık mesajlaşma sistemlerinin temelleri
• Üreticiler (Producers) ve tüketici (Consumers)
• Konular (Topics), bölümler (partitions) ve veri akışı
• Veri toplama stratejileri
Gün 3
• Akış işleme kavramları ve çerçeveleri
• Olay zamanı vs işleme zamanı
• Pencereleme teknikleri ve kullanım alanları
• Durumlu akış işleme
• Hata toleransı ve yedekleme (checkpointing) temelleri
Gün 4
• Akış hatlarında veri dönüştürme
• Gerçek zamanlı sistemlerde ETL ve ELT
• Şema yönetimi ve evrimi
• Akış birleştirme (stream joins) ve zenginleştirme
• Bul tabanlı akış servislerine giriş
Gün 5
• Akış sistemlerinde izlenebilirlik ve izleme
• Güvenlik ve erişim kontrolü temelleri
• Performans ayarlama ve optimizasyon
• Uçtan uca hat tasarımı incelemesi
• Sahte işlem tespiti ve IoT işleme gibi gerçek dünya kullanım örnekleri
Açık Eğitim Kursları 5 ve üzeri katılımcı gerektirir.
Veri Akışı ve Gerçek Zamanlı Veri İşleme Eğitimi - Rezervasyon
Veri Akışı ve Gerçek Zamanlı Veri İşleme Eğitimi - Talep Oluştur
Veri Akışı ve Gerçek Zamanlı Veri İşleme - Danışmanlık Talebi
Danışanlarımızın Yorumları (1)
El ile işlemler. Sınıfın 5 gün olması gerekiyordu, ancak 3 gün bile zaten NiFi ile çalışmaktan kaynaklanan birçok sorumu aydınlatmaya yardımcı oldu.
James - BHG Financial
Eğitim - Apache NiFi for Administrators
Yapay Zeka Çevirisi
Yaklaşan Etkinlikler
İlgili Kurslar
Gelişmiş Apache Iceberg
21 SaatlerBu eğitmen yönlendirilmiş, canlı eğitim Türkiye (çevrimiçi veya yerinde) gelişmiş düzeyde veri profesyonellerini hedeflemektedir. Eğitim, veri işleme iş akışlarını optimize etme, veri bütünlüğünü sağlama ve modern büyük veri uygulamalarının karmaşıklıklarını yönetebilen güçlü bir data lakehouse çözümü uygulama konularını ele alır.
Bu eğitim sonunda katılımcılar:
- Iceberg mimarisini, meta veri yönetimi ve dosya düzenlemesi dahil olmak üzere kapsamlı bir şekilde anlayacaklardır.
- Iceberg'ın çeşitli ortamlarda optimal performans için nasıl yapılandırılacağını ve birden fazla veri işleme motoruyla nasıl entegre edileceğini öğreneceklerdir.
- Büyük ölçekli Iceberg tablolarını yönetecek, karmaşık şema değişiklikleri gerçekleştirecek ve bölüm evrimi yönetimini ele alacaklardır.
- Büyük veri kümeleri için sorgu performansını ve veri tarama verimliliğini optimize etme tekniklerini öğreneceklerdir.
- Dağıtık ortamlarda veri tutarlılığını sağlamak, işlem garanti yönetimini uygulamak ve hataları yönetmek için mekanizmaları kullanacaklardır.
Apache Iceberg Temel Kavramlar
14 SaatlerBu eğitmen tarafından yönetilen canlı eğitim Türkiye (çevrimiçi veya yerel) başlangıç seviyesindeki veri uzmanlarına Apache Iceberg'ı etkili bir şekilde kullanarak büyük ölçekli veri kümelerini yönetmeyi, veri bütünlüğünü sağlamak ve veri işleme akışlarını optimize etmek için gerekli bilgi ve becerileri kazanma fırsatı sunmaktadır.
Bu eğitim sonunda katılımcılar şunları yapabilecektir:
- Apache Iceberg'ın mimarisi, özellikleri ve faydalarını tam olarak anlamış olacaklardır.
- Tablo formatları, bölüntulama, şema evrimi ve zaman yolculuğu yetenekleri hakkında bilgi edinmiş olacaklardır.
- Apache Iceberg'ı farklı ortamlarda kurma ve yapılandırma işlemlerini öğreneceklerdir.
- Iceberg tablolarını oluşturma, yönetme ve düzenleme işlemlerini gerçekleştirebilecektir.
- Diğer tablo formatlarından Iceberg'a veri geçiş sürecini anlayacaklardır.
Big Data Colab ve Apache Spark ile Analizler Google
14 SaatlerBu eğitmen yönetilen canlı eğitim (Türkiye çevrimiçi veya yerel) ortamında, büyük veri işleme ve analizi için Google Colab ve Apache Spark'yi kullanmak isteyen orta düzeyli veri bilimcileri ve mühendislerine yönelik olacak.
Bu eğitim sonunda katılımcılar aşağıdaki becerileri kazanabilecekler:
- Google Colab ve Spark kullanarak büyük veri ortamını kurma.
- Apache Spark ile büyük veri kümelerini etkili bir şekilde işlemek ve analiz etme.
- Kooperatif bir ortamda büyük veriyi görselleştirme.
- Apache Spark'yi bulut tabanlı araçlarla entegre etme.
Hükümet Kurumları için Büyük Veri İşletme Zekası
35 SaatlerTeknolojilerdeki ilerlemeler ve bilgi miktarında yaşanan artış, hükümet dahil birçok sektörde işin yürütülmesini dönüştürüyor. Mobil cihazlar ve uygulamalar, akıllı sensörler ve cihazlar, bulut bilişim çözümleri ve vatandaşların erişimi olan portalların hızla artan kullanımı nedeniyle hükümet veri üretim ve dijital arşivleme oranları yükselmekte. Dijital bilgi genişledikçe ve karmaşıklaştıkça, bilgi yönetimi, işlemi, depolama, güvenliği ve ortadan kaldırılması da daha karmaşık hale geliyor. Yeni yakalama, arama, keşif ve analiz araçları, organizasyonların yapılandırılmamış verilerinden faydalanmasını sağlıyor. Hükümet piyasası, bilginin stratejik bir varlık olduğunu anlayarak, hem yapılandırılmış hem de yapılandırılmamış bilgiden en iyi şekilde yararlanabilmek için güvenlik, kullanım ve analizini sağlama ihtiyacı hissediyor. Hükümet liderleri veri odaklı organizasyonları geliştirmeye çalışırken, olaylar, kişiler, süreçler ve bilgi arasındaki bağımlılıkları korelasyonlayabilecek temelleri atmaya çalışıyorlar.
Yüksek değerli hükümet çözümleri, en ayırt edici teknolojilerin bir araya getirilmesinden ortaya çıkacak:
- Mobil cihazlar ve uygulamalar
- Bulut hizmetleri
- Sosyal iş teknolojileri ve ağları
- Büyük Veri ve analitik
Büyük Veri, hükümetin büyük hacimdeki verilere dayalı olarak daha iyi kararlar alabilmesine olanak tanıyan zekî endüstri çözümlerinden biridir. Bu veriler arasında ilgili ve ilişkisiz, yapılandırılmış ve yapılandırılmamış veriler bulunabilir.
Bunları başarabilmek için sadece büyük miktarda veri toplamanın yeterli olmadığına dikkat çekmek gerekir. “Bu Büyük Veri hacimlerini anlamlandırmak, farklı ve geniş bilgi akışlarından faydalı bilgileri ayıklamaya olanak tanıyan en son araçlara ve teknolojilere ihtiyaç vardır,” Beyaz Saray Bilim ve Teknoloji Ofisi'nin Tom Kalil ve Fen Zhao, OSTP Blog'da bir yazıda yazdılar.
Hükümet kurumlarının bu teknolojileri bulmalarına yardımcı olmak için Beyaz Saray 2012 yılında Ulusal Büyük Veri Araştırma ve Geliştirme Girişimi'ni başlatmıştır. Bu girişim, Büyük Veri patlamasını en iyi şekilde değerlendirmek ve bunu analiz etmek için gereken araçları içermekteydi.
Büyük Verinin sunduğu zorluklar, vaat ettiği umut kadar korkutucudur. Bilgileri verimli bir şekilde depolama, bütçelerin sıkı olduğu durumlarda her megabayt başına depolama maliyetini en aza indirme ve kullanıcıların ihtiyaç duydukları zaman ve şekillerde erişebilmeleri için bilgileri kolay ulaşılabilir tutma, bu zorluklardan biridir. Büyük hacimdeki veriyi yedekleme, zorlukları artırmaktadır.
Veriyi etkili şekilde analiz etmek de başka bir büyük zorluktur. Birçok kurum, verinin dağlarını tarayıp daha verimli çalışmalarına yardımcı olacak trendleri tespit edebilecek ticari araçlar kullanmaktadır. (MeriTalk'in yakın zamanda gerçekleştirdiği bir araştırmaya göre, federal IT yöneticileri Büyük Verinin kurumların 500 milyon dolardan fazla tasarruf etmesine yardımcı olabileceğini düşünüyor.)
Özel geliştirilmiş Büyük Veri araçları da kurumların verilerini analiz etme ihtiyacını karşılamak için kullanılabilir. Örneğin, Oak Ridge Ulusal Laboratuvarı'nın Hesaplama Veri Analizi Grubu, diğer kurumlara Piranha veri analizi sistemini sundu. Bu sistem, tıp araştırmacılarına dokular anevrizması felci öncesi belirteçler bulmada yardımcı oldu. Ayrıca daha sıradan görevler için de kullanılmaktadır, örneğin iş adaylarını istihdam yöneticileriyle eşleştirmek için özgeçmişleri tarıyor.
Data Analysis ve Big Data'ye Pratik Bir Giriş - 3 Gün
21 SaatlerBu eğitmen liderliğindeki, canlı eğitim programını tamamlayan katılımcılar, Big Data ve ilgili teknolojileri, metodolojileri ve araçları hakkında pratik ve gerçek dünya anlayışına sahip olacaklardır.
Katılımcılar, bu bilgiyi uygulamalı egzersizler aracılığıyla uygulamaya koyma fırsatına sahip olacaklardır. Grup etkileşimi ve eğitmen geri bildirimi, dersin önemli bir parçasını oluşturmaktadır.
Kurs, Big Data'nin temel kavramlarına bir girişle başlar, ardından Data Analysis gerçekleştirmek için kullanılan programlama dilleri ve metodolojilerine ilerler. Son olarak, Big Data depolama, Dağıtık İşleme ve Scalability'yi sağlayan araçları ve altyapıyı tartışırız.
Big Data ve Advanced Analytics
42 SaatlerBig Data ve Advanced Analytics, karmaşık büyük veri kümelerini analiz ederek eylem sonrası bilgilere ve stratejik kararlar almak için gelişmiş tekniklerin ve araçların uygulanmasıdır.
Bu eğitmen yönetilen canlı eğitim (çevrimiçi veya yerel olarak) ileri düzey veri profesyonelleri için tasarlanmıştır; bu profesyoneller, tahminsel, rehberci ve gerçek zamanlı analizler için en son analitik yöntemleri ve büyük veri teknolojilerini kullanmak isteyenlerdir.
Eğitim sonunda katılımcılar şunları yapabileceklerdir:
- Yapılanaklı ve yapılandırılmamış veriler için büyük ölçekli veri işleme pipeline'larını tasarlamak ve uygulamak.
- Massif veri kümelerine gelişmiş makine öğrenmesi ve derin öğrenme tekniklerini uygulamak.
- Gerçek zamanlı analizler ve veri akışı için dağıtık hesaplama çerçevelerinden yararlanmak.
- Büyük veri analitiklerini iş zekası ve karar alma sistemlerine entegre etmek.
Eğitim Formatı
- Interaktif ders anlatımı ve tartışma.
- Farklı uygulamalar ve pratik.
- Canlı laboratuvar ortamında el ile uygulama.
Eğitim Özelleştirme Seçenekleri
- Bu eğitim için özel bir eğitim talebinde bulunmak isterseniz, lütfen bizimle iletişime geçin.
Apache NiFi Yöneticiler için
21 SaatlerApache NiFi, açık kaynaklı, akış tabanlı veri entegrasyonu ve olay işleme platformudur. Farklı sistemler arasında otomatik, gerçek zamanlı veri yönlendirmesi, dönüştürmesi ve sistem aracılaması sağlar. Web tabanlı kullanıcı arayüzü ve detaylı kontrol imkanları sunar.
Bu eğitmen yönlendirilmiş, canlı eğitim (yerinde veya uzaktan), orta düzeydeki yöneticiler ve mühendisler için düzenlenmiştir. Bu kişilerin üretim ortamlarında NiFi veri akışlarını dağıtmayı, yönetmeyi, güvemli hale getirmeyi ve optimize etmeyi öğrenmek istiyor olabilir.
Bu eğitim sonunda katılımcılar şu becerilere sahip olacaklardır:
- Apache NiFi kümelerini kurma, yapılandırma ve bakım yapma.
- Farklı kaynaklardan ve havalardan veri akışları tasarlamayı ve yönetmeyi.
- Akış otomasyonunu, yönlendirmesini ve dönüştürme mantığını uygulama.
- Performansı optimize etme, işlemlerini izleme ve sorunları giderme.
Eğitim Formatı
- Günlük mimari tartışmalarını içeren etkileşimli ders.
- Akışları oluşturma, dağıtım ve yönetme konusunda elden deneyimler.
- Canlı-lab ortamında senaryo tabanlı alıştırmalar.
Eğitim Özelleştirme Seçenekleri
- Bu eğitimin özelleştirilmiş bir sürümünü talep etmek için lütfen bizimle iletişime geçin.
PySpark ve Makine Öğrenimi
21 SaatlerBu eğitim, PySpark kullanılarak ölçeklenebilir veri işleme ve Makine Öğrenimi iş akışlarının oluşturulmasına yönelik pratik bir giriş niteliğindedir. Katılımcılar, Apache Spark'ın modern Büyük Veri ekosistemleri içinde nasıl çalıştığını ve dağıtık hesaplama ilkelerini kullanarak büyük veri kümelerini nasıl verimli bir şekilde işleyebileceklerini öğrenir.
Apache Spark Temel Kavramları
21 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), çok büyük miktarda veriyi işlemek için Apache Spark sistemini kurmak ve dağıtmak isteyen mühendislere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Apache Spark'ü kurun ve yapılandırın.
- Çok büyük veri kümelerini hızlı bir şekilde işleyin ve analiz edin.
- Apache Spark ve Hadoop MapReduce arasındaki farkı anlayın ve hangisini ne zaman kullanacağınızı bilin.
- Apache Spark'ü diğer makine öğrenimi araçlarıyla entegre edin.
Apache Spark Yönetimine Giriş
35 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), Spark kümelerini dağıtmak, sürdürmek ve optimize etmek isteyen başlangıç seviyesi ile orta seviye sistem yöneticilerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Çeşitli ortamlarda Apache Spark'yi kurmak ve yapılandırmak.
- Küme kaynaklarını yönetmek ve Spark uygulamalarını izlemek.
- Spark kümelerinin performansını optimize etmek.
- Güvenlik önlemleri uygulamak ve yüksek kullanılabilirlik sağlamak.
- Yaygın Spark sorunlarını ayıklamak ve gidermek.
Apache Spark Bulutta
21 SaatlerApache Spark'nin öğrenme eğrisi başlangıçta yavaş yükselir ve ilk sonuçları elde etmek için çok çaba gerektirir. Bu kursun amacı, bu zorlu başlangıcı atlatmanıza yardımcı olmaktır. Bu kursu tamamlayan katılımcılar, Apache Spark'ün temellerini anlayacak, RDD ile DataFrame arasındaki farkı net bir şekilde ayırt edebilecek, Python ve Scala API'lerini öğrenecek, yürütücüler ve görevler hakkında bilgi sahibi olacaklardır. Ayrıca en iyi uygulamaları takip ederek, bu kurs bulut dağıtımı, Databricks ve AWS'ye güçlü bir şekilde odaklanmaktadır. Öğrenciler ayrıca AWS EMR ve AWS Glue arasındaki farkları, AWS'nin en son Spark hizmetlerinden birini anlayacaklardır.
HEDEF KİTLE:
Veri Mühendisi, DevOps, Veri Bilimcisi
Python ve Büyük Veri için Spark (PySpark)
21 SaatlerBu eğitmen liderliğindeki, canlı eğitimde Türkiye, katılımcılar büyük verileri analiz etmek için Python ve Spark'ı birlikte nasıl kullanacaklarını uygulamalı egzersizler yaparak öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Python ile Spark'ı kullanarak Big Data analiz etmeyi öğreneceklerdir.
- Gerçek dünya senaryolarını taklit eden egzersizler üzerinde çalışacaklardır.
- PySpark kullanarak büyük veri analizi için farklı araç ve teknikleri kullanacaklardır.
Python, Spark ve Hadoop için Büyük Veri
21 SaatlerBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), büyük ve karmaşık veri kümelerini işlemek, analiz etmek ve dönüştürmek için Spark, Hadoop ve Python'yı kullanmak ve entegre etmek isteyen geliştiricilere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Spark, Hadoop ve Python ile büyük veri işlemeye başlamak için gerekli ortamı kurmak.
- Spark ve Hadoop'in özelliklerini, temel bileşenlerini ve mimarisini anlamak.
- Büyük veri işleme için Spark, Hadoop ve Python'yı nasıl entegre edeceğini öğrenmek.
- Spark ekosistemindeki araçları (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka ve Flume) keşfetmek.
- Netflix, YouTube, Amazon, Spotify ve Google gibi işbirlikçi filtreleme öneri sistemleri oluşturmak.
- Apache Mahout'u kullanarak makine öğrenimi algoritmalarını ölçeklendirmek.
Stratio: Rocket ve Intelligence Modülleri ile PySpark
14 SaatlerStratio, büyük veri, yapay zeka ve yönetim alanlarını tek bir çözümde entegre eden, veri odaklı bir platformdur. Rocket ve Intelligence modüllerinin yardımıyla, kurumsal ortamlarda hızlı veri keşfi, dönüştürme ve gelişmiş analitik işlemler gerçekleştirilebilir.
Bu eğitmen rehberli canlı eğitim (çevrimiçi veya yerinde) PySpark'i döngü yapıları, kullanıcı tanımlı fonksiyonlar ve gelişmiş veri mantığı üzerinde odaklanarak Stratio'daki Rocket ve Intelligence modüllerini etkili şekilde kullanmayı öğrenmek isteyen orta seviye veri profesyonellerine yöneliktir.
Bu eğitimden sonra katılımcılar şunları yapabilecekler:
- Rocket ve Intelligence modüllerini kullanarak Stratio platformunda gezinme ve çalışma.
- Veri alımı, dönüştürme ve analiz bağlamında PySpark'ı uygulama.
- Veri iş akışlarını ve özellik mühendisliği görevlerini kontrol etmek için döngüler ve koşullu mantık kullanma.
- PySpark'ta tekrar kullanılabilir veri işlemleri için kullanıcı tanımlı fonksiyonlar (UDFs) oluşturma ve yönetme.
Eğitim Biçimi
- Etkileşimli ders ve tartışma.
- Birçok alıştırma ve uygulama.
- Canlı-lab ortamında el ile uygulama.
Eğitim Özelleştirme Seçenekleri
- Bu eğitimin özelleştirilmiş bir sürümünü talep etmek için lütfen bizimle iletişime geçin.