SMACK Yığını Data Science için Eğitimi
SMACK, veri platformu yazılımlarından, yani Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra ve Apache Kafka'den oluşan bir koleksiyondur. S MAC K yığını kullanılarak kullanıcılar veri işleme platformları oluşturabilir ve ölçeklendirebilir.
Bu eğitmen liderliğindeki, canlı eğitim (çevrimiçi veya yerinde), büyük veri çözümleri için S MAC K yığınını kullanarak veri işleme platformları oluşturmak isteyen veri bilimcilerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Büyük verileri işlemek için bir veri hattı mimarisi uygulayın.
- Apache Mesos ve Docker ile bir küme altyapısı geliştirin.
- Spark ve Scala ile verileri analiz edin.
- Apache Cassandra ile yapılandırılmamış verileri yönetin.
Kurs Formatı
- Etkileşimli ders ve tartışma.
- Çok sayıda alıştırma ve uygulama.
- Canlı laboratuvar ortamında uygulamalı uygulama.
Kurs Özelleştirme Seçenekleri
- Bu kurs için özelleştirilmiş bir eğitim talep etmek için lütfen bizimle iletişime geçin.
Eğitim İçeriği
Giriş
S MAC K Yığınına Genel Bakış
- Apache Spark Nedir? Apache Spark özellikleri
- Apache Mesos Nedir? Apache Mesos özellikleri
- Apache Akka Nedir? Apache Akka özellikleri
- Apache Cassandra Nedir? Apache Cassandra özellikleri
- Apache Kafka Nedir? Apache Kafka özellikleri
Scala Dili
- Scala sözdizimi ve yapısı
- Scala kontrol akışı
Geliştirme Ortamının Hazırlanması
- S MAC K yığınının kurulması ve yapılandırılması
- Docker'in kurulması ve yapılandırılması
Apache Akka
- Aktörlerin kullanılması
Apache Cassandra
- Okuma işlemleri için bir veritabanı oluşturma
- Yedeklemeler ve kurtarma ile çalışma
Bağlayıcılar
- Bir akış oluşturma
- Akka uygulaması oluşturma
- Cassandra ile veri depolama
- Bağlayıcıların gözden geçirilmesi
Apache Kafka
- Kümeleme ile çalışma
- Mesaj oluşturma, yayınlama ve tüketme
Apache Mesos
- Kaynak tahsis etme
- Küme çalıştırma
- Apache Aurora ve Docker ile çalışma
- Hizmetleri ve işleri çalıştırma
- Mesos üzerinde Spark, Cassandra ve Kafka'yı dağıtma
Apache Spark
- Veri akışlarını yönetme
- RDD'ler ve veri çerçeveleri ile çalışma
- Veri analizi yapma
Sorun Giderme
- Hizmetlerin ve hataların başarısızlığıyla başa çıkma
Özet ve Sonuç
Kurs İçin Gerekli Önbilgiler
- Veri işleme sistemlerine ilişkin bir anlayış
Hedef Kitle
- Veri Bilimcileri
Açık Eğitim Kursları 5 ve üzeri katılımcı gerektirir.
SMACK Yığını Data Science için Eğitimi - Booking
SMACK Yığını Data Science için Eğitimi - Enquiry
SMACK Yığını Data Science için - Danışmanlık Talebi
Danışmanlık Talebi
Danışanlarımızın Yorumları (1)
çok etkileşimli...
Richard Langford
Eğitim - SMACK Stack for Data Science
Yapay Zeka Çevirisi
Yaklaşan Etkinlikler
İlgili Kurslar
Yapay Zeka - en çok uygulanan şeyler - Data Analysis + Dağıtık Yapay Zeka + Doğal Dil İşleme
21 SaatBu kurs, uygulamalarında yapay zekayı anlamak ve uygulamak isteyen geliştiricilere ve veri bilimcilerine yöneliktir. Özellikle veri analizi, dağıtık yapay zeka ve doğal dil işleme konularına odaklanmaktadır.
Anaconda Veri Bilimcileri için Ekosistem
14 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), paketleri ve veri analizi iş akışlarını tek bir platformda yakalamak, yönetmek ve dağıtmak için Anaconda ekosistemini kullanmak isteyen veri bilimcilerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Anaconda bileşenlerini ve kütüphanelerini kurmak ve yapılandırmak.
- Anaconda'ün temel kavramlarını, özelliklerini ve faydalarını anlamak.
- Anaconda Navigator kullanarak paketleri, ortamları ve kanalları yönetmek.
- Veri bilimi ve makine öğrenimi için Conda, R ve Python paketlerini kullanmak.
- Çoklu veri ortamlarını yönetmek için bazı pratik kullanım durumlarını ve teknikleri öğrenmek.
Big Data Business Intelligence Telecom ve Communication Hizmet Sağlayıcılar için
35 SaatGenel Bakış
İletişim hizmeti sağlayıcıları (CSP'ler), mükemmel müşteri deneyimi sağlarken maliyetleri düşürme ve kullanıcı başına ortalama geliri (ARPU) en üst düzeye çıkarma konusunda baskı altındadır, ancak veri hacimleri artmaya devam etmektedir. Küresel mobil veri trafiği, 2016'ya kadar yıllık bileşik büyüme oranı (CAGR) olarak %78 artarak aylık 10,8 exabyte'a ulaşacaktır.
Bu arada, CSP'ler çağrı detay kayıtları (CDR), ağ verileri ve müşteri verileri dahil olmak üzere büyük miktarda veri üretmektedir. Bu verileri tam olarak kullanan şirketler rekabet avantajı elde etmektedir. The Economist Intelligence Unit tarafından yapılan son bir ankete göre, veri odaklı karar alma kullanan şirketler %5-6 oranında verimlilik artışı elde etmektedir. Ancak şirketlerin %53'ü değerli verilerinin yalnızca yarısını kullanmakta ve katılımcıların dörtte biri, çok miktarda kullanışlı verinin kullanılmadığını belirtmektedir. Veri hacimleri o kadar yüksektir ki manuel analiz imkansızdır ve çoğu eski yazılım sistemi ayak uyduramamaktadır, bu da değerli verilerin atılmasına veya göz ardı edilmesine neden olmaktadır.
Big Data & Analytics’in yüksek hızlı, ölçeklenebilir büyük veri yazılımıyla, CSP'ler daha kısa sürede daha iyi karar almak için tüm verilerini çıkarabilirler. Farklı Big Data ürünleri ve teknikleri, büyük verilerden içgörüler toplamak, hazırlamak, analiz etmek ve sunmak için uçtan uca bir yazılım platformu sağlar. Uygulama alanları arasında ağ performansı izleme, dolandırıcılık tespiti, müşteri kaybı tespiti ve kredi risk analizi yer almaktadır. Big Data & Analytics ürünleri terabaytlarca veriyi işleyecek şekilde ölçeklenebilir, ancak bu tür araçların uygulanması Hadoop gibi yeni nesil bulut tabanlı veritabanı sistemleri veya devasa ölçekli paralel işlemci (KPU vb.) gerektirir.
Bu kurs, CSP'lerin verimlilik kazanımı için yatırım yaptığı ve yeni iş gelir akışları açtığı tüm yeni alanları kapsayan Big Data BI for Telco konusunu ele almaktadır. Kurs, karar vericilerin ve yöneticilerin Big Data BI'ın Telco'daki potansiyelini tam olarak anlamalarını sağlamak için Big Data BI'ın Telco'daki 360 derecelik kapsamlı bir genel bakışını sunacaktır.
Kurs Hedefleri
Kursun ana hedefi, Telecom Business'ün 4 sektöründe (Marketing/Satış, Ağ Operasyonları, Finansal Operasyonlar ve Müşteri İlişkileri Management) yeni Big Data iş zekası tekniklerini tanıtmakdır. Öğrencilere aşağıdakiler tanıtılacaktır:
- Big Data'ya giriş - Big Data'daki 4V (hacim, hız, çeşitlilik ve doğruluk) nedir - Telco perspektifinden oluşturma, çıkarma ve yönetme
- Big Data analitiğinin eski veri analitiğinden nasıl farklı olduğu
- Big Data'nın şirket içi gerekçelendirilmesi - Telco perspektifi
- Hadoop Ekosistemine giriş - Big Data sorunlarını çözmek için ne zaman ve nasıl kullanılacakları konusunda Hive, Pig, SPARC gibi tüm Hadoop araçlarına aşinalık
- Big Data'nın analitik araçlar için nasıl çıkarıldığı - Business Analysis'ün entegre Hadoop gösterge panosu yaklaşımı aracılığıyla veri toplama ve analizindeki sorun noktalarını nasıl azaltabileceği
- Telco için temel içgörü analitiği, görselleştirme analitiği ve tahmin analitiği tanıtımı
- Müşteri kaybı analitiği ve Big Data - Big Data analitiğinin Telco'da müşteri kaybını ve müşteri memnuniyetsizliğini nasıl azaltabileceği - vaka çalışmaları
- Ağ meta verilerinden ve IPDR'den ağ arızası ve hizmet arızası analitiği
- Satış ve operasyonel verilerden finansal analiz - dolandırıcılık, israf ve yatırım getirisi tahmini
- Müşteri edinme sorunu - hedef pazarlama, müşteri segmentasyonu ve satış verilerinden çapraz satış
- Tüm Big Data analitik ürünlerinin tanıtımı ve Telco analitik alanına nasıl uydukları
- Sonuç - Big Data Business Intelligence'yi kuruluşunuzda adım adım nasıl tanıtacağınız
Hedef Kitle
- Ağ operasyonları, Finansal Yöneticiler, CRM Yöneticileri ve Telco CIO ofisindeki üst düzey BT Yöneticileri.
- Telco'daki Business Analistleri
- CFO ofisi yöneticileri/analistleri
- Operasyonel Yöneticiler
- Kalite Güvence Yöneticileri
Data Science Programme
245 SaatThe explosion of information and data in today’s world is un-paralleled, our ability to innovate and push the boundaries of the possible is growing faster than it ever has. The role of Data Scientist is one of the highest in-demand skills across industry today.
We offer much more than learning through theory; we deliver practical, marketable skills that bridge the gap between the world of academia and the demands of industry.
This 7 week curriculum can be tailored to your specific Industry requirements, please contact us for further information or visit the Nobleprog Institute website
Audience:
This programme is aimed post level graduates as well as anyone with the required pre-requisite skills which will be determined by an assessment and interview.
Delivery:
Delivery of the course will be a mixture of Instructor Led Classroom and Instructor Led Online; typically the 1st week will be 'classroom led', weeks 2 - 6 'virtual classroom' and week 7 back to 'classroom led'.
Data Science for Big Data Analytics
35 SaatBüyük veri, geleneksel veri işleme uygulama yazılımlarının yetersiz kaldığı kadar hacimli ve karmaşık veri kümeleridir. Büyük veri zorlukları arasında veri yakalama, veri depolama, veri analizi, arama, paylaşım, aktarım, görselleştirme, sorgulama, güncelleme ve bilgi gizliliği yer alır.
Giriş Graph Computing
28 SaatBu eğitmen liderliğindeki canlı eğitimde, katılımcılar grafik verileri işleme teknolojilerini ve uygulama yaklaşımlarını Türkiye bölgesinde öğreneceklerdir. Amaç, gerçek dünyadaki nesneleri, özelliklerini ve ilişkilerini belirlemek, ardından bu ilişkileri modellemek ve Graph Computing (aynı zamanda Grafik Analitiği olarak da bilinir) yaklaşımını kullanarak bunları veri olarak işlemektir. Geniş bir genel bakışla başlayıp bir dizi vaka çalışması, uygulamalı alıştırma ve canlı dağıtım aracılığıyla belirli araçlara odaklanacağız.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Grafik verilerin nasıl kalıcı hale getirildiğini ve gezildiğini anlayabilmek.
- Belirli bir görev için en iyi çerçeveyi seçebilmek (grafik veritabanlarından toplu işleme çerçevelerine kadar).
- Hadoop, Spark, GraphX ve Pregel'i birçok makinede paralel olarak grafik hesaplaması yapmak için uygulayabilmek.
- Gerçek dünya büyük veri sorunlarını grafikler, süreçler ve geçişler açısından görebilmek.
Jupyter for Data Science Teams
7 SaatBu eğitmen liderliğindeki, canlı eğitimde (Türkiye – çevrimiçi veya yerinde), veri biliminde işbirliğine dayalı geliştirme fikri tanıtılır ve Jupyter'ın "hesaplamalı bir fikrin yaşam döngüsü"nde nasıl kullanıldığı gösterilir. Katılımcılar, Jupyter ekosistemi üzerine kurulu örnek bir veri bilimi projesi oluşturma sürecinde yönlendirilir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Jupyter'ı kurmak ve yapılandırmak, bir ekip deposu oluşturmak ve Git ile entegre etmek.
- Proje işbirliğini sağlamak için Jupyter'ın uzantıları, etkileşimli widget'lar, çok kullanıcılı mod ve daha fazlası gibi özelliklerini kullanmak.
- Jupyter Notebook'ları ekip üyeleriyle oluşturmak, paylaşmak ve düzenlemek.
- Scala, Python, R arasından seçim yaparak, Apache Spark gibi büyük veri sistemlerine karşı kod yazmak ve yürütmek, tüm bunlar Jupyter arayüzü üzerinden.
Kaggle
14 SaatBu eğitmen liderliğindeki, canlı eğitim (online veya yerinde), Data Science kullanarak kariyerlerini geliştirmek isteyen veri bilimcileri ve geliştiricileri hedeflemektedir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Veri bilimi ve makine öğrenimi hakkında bilgi edinin.
- Veri analitiğini keşfedin.
- Kaggle hakkında bilgi edinin ve nasıl çalıştığını öğrenin.
MATLAB Temeller, Data Science & Rapor Oluşturma
35 SaatBu eğitim programının ilk bölümünde, MATLAB'ın hem bir dil hem de bir platform olarak temel ilkelerini ve işlevlerini ele alıyoruz. Bu tartışmaya MATLAB sözdizimi, diziler ve matrisler, veri görselleştirme, betik geliştirme ve nesne yönelimli ilkeler de dahil edilmiştir.
İkinci bölümde, MATLAB'ın veri madenciliği, makine öğrenimi ve öngörülü analiz için nasıl kullanılacağını gösteriyoruz. Katılımcılara MATLAB'ın yaklaşımının ve gücünün net ve pratik bir perspektifini sunmak için, MATLAB kullanımını elektronik tablolar, C, C++ ve Visual Basic gibi diğer araçlarla karşılaştırıyoruz.
Eğitimin üçüncü bölümünde, katılımcılar veri işleme ve rapor oluşturmayı otomatikleştirerek çalışmalarını nasıl kolaylaştıracaklarını öğrenirler.
Kurs boyunca, katılımcılar öğrendikleri fikirleri bir laboratuvar ortamında uygulamalı egzersizlerle pekiştireceklerdir. Eğitimin sonunda, katılımcılar MATLAB'ın yeteneklerine dair kapsamlı bir anlayışa sahip olacak ve gerçek dünya veri bilimi problemlerini çözmek ve otomasyon yoluyla çalışmalarını kolaylaştırmak için bunu kullanabileceklerdir.
İlerlemenizi ölçmek için kurs boyunca değerlendirmeler yapılacaktır.
Kurs Formatı
- Kurs, teorik ve pratik egzersizler, vaka tartışmaları, örnek kod incelemesi ve uygulamalı uygulamaları içerir.
Not
- Uygulama oturumları, önceden düzenlenmiş örnek veri rapor şablonlarına dayanacaktır. Özel gereksinimleriniz varsa, lütfen bizimle iletişime geçerek düzenleme yapabilirsiniz.
İş Akışlarını Python Pandas ile Modin Hızlandırma
14 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), daha hızlı veri analizi için Pandas ile paralel hesaplamalar oluşturmak ve uygulamak isteyen veri bilimcileri ve geliştiricileri hedeflemektedir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Modin ile ölçeklenebilir Pandas iş akışlarını geliştirmek için gerekli ortamı kurmak.
- Modin'in özelliklerini, mimarisini ve avantajlarını anlamak.
- Modin, Dask ve Ray arasındaki farkları bilmek.
- Modin ile Pandas işlemlerini daha hızlı gerçekleştirmek.
- Tüm Pandas API'sini ve işlevlerini uygulamak.
Python Programming for Finance
35 SaatPython, finans sektöründe büyük popülerlik kazanan bir programlama dilidir. En büyük yatırım bankaları ve hedge fonları tarafından benimsenen Python, temel ticaret programlarından risk yönetimi sistemlerine kadar geniş bir yelpazedeki finans uygulamalarını oluşturmak için kullanılmaktadır.
Bu eğitmen liderliğindeki canlı eğitimde, katılımcılar Python'yi kullanarak finansla ilgili belirli sorunları çözmek için pratik uygulamalar geliştirmeyi öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Python programlama dilinin temellerini anlayabilecektir
- Python ile finans uygulamaları oluşturmak için en iyi geliştirme araçlarını indirebilecek, kurabilecek ve bakımını yapabilecektir
- Çeşitli kaynaklardan (CSV, Excel, veritabanları, web vb.) finansal verileri düzenlemek, görselleştirmek ve analiz etmek için en uygun Python paketlerini ve programlama tekniklerini seçebilecek ve kullanabilecektir
- Varlık tahsisi, risk analizi, yatırım performansı ve daha fazlası ile ilgili sorunları çözebilecek uygulamalar oluşturabilecektir
- Python uygulamasında sorun giderebilecek, entegre edebilecek, dağıtabilecek ve optimize edebilecektir
Hedef Kitle
- Geliştiriciler
- Analistler
- Kantitatif Analistler
Kurs Formatı
- Kısmen ders anlatımı, kısmen tartışma, egzersizler ve yoğun uygulamalı çalışma
Not
- Bu eğitim, finans profesyonellerinin karşılaştığı temel sorunlara çözümler sunmayı amaçlamaktadır. Ancak, eklemek veya daha ayrıntılı açıklamak istediğiniz belirli bir konu, araç veya teknik varsa, lütfen bizimle iletişime geçin.
GPU Data Science NVIDIA RAPIDS ile
14 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), RAPIDS kullanarak GPU hızlandırılmış veri işlem hatları, iş akışları ve görselleştirmeler oluşturmak isteyen veri bilimcileri ve geliştiricilere yöneliktir; XGBoost, cuML gibi makine öğrenimi algoritmalarını uygulayarak.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- NVIDIA RAPIDS ile veri modelleri oluşturmak için gerekli geliştirme ortamını kurmak.
- RAPIDS’nin özelliklerini, bileşenlerini ve avantajlarını anlamak.
- Uçtan uca veri ve analiz işlem hatlarını hızlandırmak için GPU’ları kullanmak.
- cuDF ve Apache Arrow ile GPU hızlandırılmış veri hazırlama ve ETL uygulamak.
- XGBoost ve cuML algoritmalarıyla makine öğrenimi görevlerini nasıl gerçekleştireceğini öğrenmek.
- cuXfilter ve cuGraph ile veri görselleştirmeleri oluşturmak ve grafik analizi yapmak.
Python ve Spark Big Data için (PySpark)
21 SaatBu eğitmen liderliğindeki, canlı eğitimde Türkiye, katılımcılar büyük verileri analiz etmek için Python ve Spark'ı birlikte nasıl kullanacaklarını uygulamalı egzersizler yaparak öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Python ile Spark'ı kullanarak Big Data analiz etmeyi öğreneceklerdir.
- Gerçek dünya senaryolarını taklit eden egzersizler üzerinde çalışacaklardır.
- PySpark kullanarak büyük veri analizi için farklı araç ve teknikleri kullanacaklardır.
Apache Spark MLlib
35 SaatMLlib, Spark’ın makine öğrenimi (ML) kütüphanesidir. Amacı, pratik makine öğrenimini ölçeklenebilir ve kolay hale getirmektir. Sınıflandırma, regresyon, kümeleme, işbirlikçi filtreleme, boyut azaltma gibi yaygın öğrenme algoritmaları ve yardımcı programlarının yanı sıra daha düşük seviyeli optimizasyon öncülleri ve daha yüksek seviyeli pipeline API’lerinden oluşur.
İki pakete ayrılır:
-
spark.mllib, RDD’ler üzerine inşa edilmiş orijinal API’yi içerir.
-
spark.ml, ML pipeline’ları oluşturmak için DataFrames üzerine inşa edilmiş daha yüksek seviyeli bir API sağlar.
Hedef Kitle
Bu kurs, Apache Spark için yerleşik bir Makine Öğrenimi Kütüphanesini kullanmak isteyen mühendisler ve geliştiricilere yöneliktir.
Data Science: Analiz ve Sunum
7 SaatWolfram Sistemi'nin entegre ortamı, onu veri analiz ve sunumu için verimli bir araç haline getirir. Bu kurs, analize yönelik Wolfram Dili'nin istatistiksel hesaplama, görselleştirme, veri içe ve dışa aktarma ve otomatik rapor oluşturma gibi yönlerini kapsamaktadır.