Eğitim İçeriği
Günlük konu bölünmeleri: (Her oturum 2 saat)
1. Gün - Oturum 1: Büyük Veri İşletme Zekası'nın Telco'da neden önemli olduğu iş bakış açısı.
- T-Mobile, Verizon gibi şirketlerden örnekler
- Kuzey Amerika Telcosu'nda Büyük Veri benimsenme oranı ve gelecekteki iş modelinin ve operasyonunun Büyük Veri İşletme Zekası etrafında nasıl hizalanması
- Geniş Uygulama Alanı
- Ağ ve Hizmet Yönetimi
- Müşteri Kaybı Yönetimi
- Veri Entegrasyonu & Panoda Görselleştirme
- Kuyruk Yönetimi
- İş Kuralı Üretimi
- Müşteri Profil Oluşturma
- Yerel Reklam Yayını
1. Gün - Oturum 2: Büyük Veri Tanımı-1
- Büyük Veri'nin temel özellikleri - hacim, çeşitlilik, hız ve doğruluk. Hacim için MPP mimarisi.
- Veri Depolamaları - statik şema, yavaş bir şekilde evrilen veri seti
- MPP Veritabanları gibi Greenplum, Exadata, Teradata, Netezza, Vertica vb.
- Hadoop tabanlı çözümler - veri setinin yapısı üzerinde şartlar koymaz.
- Tipik desen: HDFS, MapReduce (işleme), HDFS'ten alma
- Toplu işlem - analitik/etkileşim dışı için uygun
- Hacim: CEP akış verisi
- Tipik seçenekler - CEP ürünleri (ör. Infostreams, Apama, MarkLogic vb.)
- Daha az üretim hazırı - Storm/S4
- NoSQL Veritabanları - (sütunlu ve anahtar-değer): Veri depolaması/veritabanının analitik ek bileşeni olarak en uygun
1. Gün - Oturum 3: Büyük Veri Tanımı-2
NoSQL çözümleri
- Anahtar-Değer Depolama - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
- Anahtar-Değer Depolama - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
- Anahtar-Değer Depolama (Hiyerarşik) - GT.m, Cache
- Anahtar-Değer Depolama (Sıralı) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
- Anahtar-Değer Önbellek - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
- Tuple Depolama - Gigaspaces, Coord, Apache River
- Nesne Veritabanı - ZopeDB, DB40, Shoal
- Belge Depolama - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Veritabanları, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
- Geniş Sütunlu Depolama - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
Farklı Veri Türleri: Büyük Veride Veri Temizleme Sorunu Tanımı
- RDBMS - statik yapı/şema, esnek ve keşfedici ortamı desteklemiyor.
- NoSQL - yarı yapılandırılmış, veriyi depolarken tam olarak şemayı tanımlamadan yeterli bir yapı
- Veri temizleme sorunları
1. Gün - Oturum 4: Büyük Veri Tanımı-3 : Hadoop
- Hadoop ne zaman seçilmeli?
- YAPISAL - Kurumsal veri depoları/veritabanları (maliyetle) büyük veriyi depolayabilir ancak yapıyı zorlar (etkin keşfede kötü)
- YARI YAPILANDIRILMIŞ veri - geleneksel çözümlerle (DW/DB) zordur
- Veri depolama = büyük çaba ve hatta uygulandıktan sonra statik
- Hacim & Çeşitlilik için, uygun maliyetli donanım üzerinde işleme - HADOOP
- Uygun maliyetli H/W, Hadoop Klusteri oluşturmak için gerekli
Hadoop ve HDFS'e Giriş
- MapReduce - birden fazla sunucu üzerinde dağıtılmış işlem
- HDFS - hesaplama süreci için yerel olarak verinin kullanılabilir olmasını sağlar (yedekleme ile)
- Veri - yapılandırılmamış/şemasız olabilir (RDBMS'e karşı)
- Geliştiricinin veriyi anlamasını sağlaması gerekiyor
- MapReduce programlama = Java ile çalışmak (avantajlar/ dezavantajlar), manuel olarak HDFS'ye veri yükleme
2. Gün - Oturum 1.1: Spark : Bellekte Dağıtılmış Veritabanı
- Bellekten işlem nedir?
- Spark SQL
- Spark SDK
- Spark API
- RDD
- Spark Lib
- Hanna
- Mevcut bir Hadoop sisteminin Spark'a geçiş yolu
2. Gün - Oturum 1.2: Storm - Büyük Veride Gerçek Zamanlı İşlem
- Akışlar
- Sprouts
- Bolts
- Topolojiler
2. Gün - Oturum 2: Büyük Veri Yönetim Sistemi
- Hareket parçaları, hesaplama düğümleri başlar/başarısız olur: ZooKeeper - yapılandırma/koordinasyon/adlandırma hizmetleri
- Karmaşık ardışık işlem/çalışma akışı: Oozie - çalışma akışı yönetimi, bağımlılıklar, daisy zinciri
- Dağıtım, yapılandırma, klaster yönetimi, yükseltme vb. (sistem yöneticisi): Ambari
- Bulut'ta: Whirr
- Gelişen Büyük Veri platformu araçları izleme için
- ETL katmanı uygulama sorunları
2. Gün - Oturum 3: Tahmine Dayalı Analitik İşletme Zekası-1: Temel Teknikler ve Makine Öğrenimi Tabanlı BI :
- Makine öğrenimine giriş
- Sınıflandırma teknikleri öğrenme
- Bayesian tahmin - eğitim dosyasının hazırlanması
- Markov rastgele alanı
- Yönetilen ve yönetilmeyen öğrenim
- Özellik çıkarma
- Destek Vektör Makinesi
- Sinir Ağı
- Gözetimsiz öğrenme
- Büyük Veride çok değişkenli problem - Rastgele Orman (RF)
- Temsil öğrenimi
- Derin öğrenme
- Büyük Veri Otomasyonu problemi - Çok model topluluğu RF
- Otomasyon Soft10-M ile
- LDA ve konu modelleme
- Esnek öğrenme
- Telco operasyonundan örnek - ajan tabanlı öğrenme
- Telco operasyonundan örnek - dağıtık öğrenme
- Tahmine dayalı analitik için açık kaynak araçları giriş: R, Rapidminer, Mahut
- Daha ölçeklenebilir Analitik - Apache Hama, Spark ve CMU Graph Lab
2. Gün - Oturum 4 Tahmine Dayalı Analitik Ekosistemi-2: Telekom'da Ortak Tahmine Dayalı Analitik Sorunları
- Öngörüler analitiği
- Görselleştirme analitiği
- Yapılandırılmış tahmine dayalı analitiği
- Yapılandırılmamış tahmine dayalı analitiği
- Müşteri profillemesi
- Tavsiye Motoru
- Desen tespiti
- Kural/Senaryo keşfi - başarısızlık, kuyruk, optimizasyon
- Kök neden keşfi
- Duygu analitiği
- CRM analitiği
- Ağ analitiği
- Metin Analitiği
- Teknoloji destekli inceleme
- Kuyruk analitiği
- Gerçek Zamanlı Analitik
3. Gün - Oturum 1: Ağ Operasyonu Analitiği - ağ başarısızlıklarının, hizmet kesintilerinin meta verileri, IPDR ve CRM'den kök neden analizi:
- CPU Kullanımı
- Bellek Kullanımı
- QoS Kuyruğu Kullanımı
- Cihaz Sıcaklığı
- Arayüz Hatası
- IoS sürümleri
- Rotalama Olayları
- Gecikme Değişimi
- Syslog analitiği
- Paket Kaybı
- Yük Benzetimi
- Topoloji Çıkarımı
- Performans Eşiği
- Cihaz Tuşları
- IPDR (IP detay kaydı) toplama ve işleme
- Abone Bant Genişliği tüketimi, ağ arayüz kullanımı, modem durumu ve tanılama için IPDR verisi kullanımı
- HFC bilgileri
3. Gün - Oturum 2: Ağ Hizmet Başarısızlığı Analizi İçin Araçlar:
- Ağ Özeti Panosu: tüm ağ dağıtımlarınızı izleyin ve kuruluşunuzun ana performans göstergelerini takip edin
- Zirve Dönem Analitiği Panosu: zirve kullanımı sürücülerinin, konum spesifik ayrıntılarla, uygulama ve abone trendlerini anlayın
- Rotalama Verimliliği Panosu: interconnect ve transit ilişkileri hakkında tam bir anlamayla ağ maliyetlerinizi kontrol edin ve sermaye projeleri için iş durumları oluşturun
- Gerçek Zamanlı Eğlence Panosu: video izlemeleri, süre ve video deneyimi kalitesi (QoE) dahil olmak üzere önemli metrikleri erişin
- IPv6 Geçiş Panosu: IPv6'nın ağınızda devam eden benimsenmesini araştırın ve trendleri sürükleyen uygulamaları ve cihazları keşfedin
- Örnek-1: Alcatel-Lucent Büyük Ağ Analitiği (BNA) Veri Madencisi
- Çok boyutlu mobil zeka (m.IQ6)
3. Gün - Oturum 3: Satış/Müşteri Hedefleme için Büyük Veri BI - Satış verisinden satış/pazarlama anlayışı: (Tümü canlı tahmine dayalı analitik demo ile gösterilecek)
- En yüksek hızlı müşterilerin tespiti
- Belli ürünler için hedef müşteri tespiti
- Müşteri için doğru ürün setinin belirlenmesi (Tavsiye Motoru)
- Pazar segmentasyon tekniği
- Çapraz satış ve üst satış tekniği
- Müşteri segmentasyon tekniği
- Satış geliri tahmin teknikleri
3. Gün - Oturum 4: Telco CFO Ofisi için BI:
- CFO ofisinde iş analitiği çalışmalarına genel bakış
- Yeni yatırım üzerinde risk analizi
- Gelir, kâr tahmini
- Yeni müşteri kazanma tahmini
- Kayıp tahmini
- Mali kayıtlardaki kuyruk analitiği (daha fazla ayrıntı son oturumda)
4. Gün - Oturum 1: Telco'da Büyük Veri ile Kuyruk Önleme BI - Kuyruk Analitiği:
- Bant genişliği sızıntısı / Bant genişliği kuyruğu
- Tedarikçi kuyruğu / projeler için fazla ücretlendirme
- Müşteri iade / talep kuyrukları
- Yolculuk tazminatı kuyrukları
4. Gün - Oturum 2: Müşteri Kaybı Tahmini'den Müşteri Kaybı Önlemeye Geçiş:
- Müşteri Kaybının 3 Türü: Aktif/Deliberate, Döngüsel/İlginç, Pasif Zorunlu
- Kaybedilen Müşterilerin 3 Sınıflandırılması: Toplam, Gizli, Kısmi
- Müşteri kaybı için CRM değişkenlerini anlama
- Müşteri davranış verisi toplama
- Müşteri algısı verisi toplama
- Müşteri demografik verisi toplama
- CRM Verisini Temizleme
- Müşteri kaybı analitiği için yapılandırılmamış CRM verisi (müşteri araması, biletler, e-postalar) ve yapılandırılmış veriye çevirilmesi
- Sosyal Medya CRM - müşteri memnuniyet endeksi çıkarmak için yeni bir yol
- Örnek-1: T-Mobile USA: Müşteri kaybı %50 azalma
4. Gün - Oturum 3: Tahmine Dayalı Analitik ile müşteri memnuniyetsizliği kök neden analizi için nasıl kullanılabilir:
- Örnek-1: Memnuniyetsizlikin hesaplamaya bağlanması - hizmet kesintisi, düşük bant genişliği hizmeti gibi muhasebe ve mühendislik başarısızlıkları
- Örnek-2: Büyük Veri QA panosu - çağrı yükseltmeleri, sorunların kritikliği, devam eden hizmet kesintisi olayları gibi çeşitli parametrelerden müşteri memnuniyet endeksi izlemesi
4. Gün - Oturum 4: Farklı verilere hızlı erişim ve gösterimi için Büyük Veri Pano:
- Mevcut uygulama platformunun Büyük Veri Panosu ile entegrasyonu
- Büyük Veri yönetimi
- Büyük Veri Pano Örneği: Tableau ve Pentaho
- Büyük Veri uygulamasını kullanarak konum bazlı reklam yayına alınması
- İzleme sistemi ve yönetimi
5. Gün - Oturum 1: Kuruluza - Organizasyon içinde Büyük Veri BI uygulanmasının nasıl gerekçelendirileceği:
- Büyük Veri uygulaması için ROI tanımlama
- Verinin toplama ve hazırlanması için Analist Zamanı tasarrufu - üretkenlik kazancı artışına örnekle
- Müşteri kaybından gelir kazancı örneklere
- Konum bazlı ve hedeflenmiş reklamdan gelir kazancı
- Büyük Veri uygulamasının maliyeti ile gelir kazancı/kazanç arasında yaklaşık bir hesaplama için entegre bir elektronik tablo yaklaşımı.
5. Gün - Oturum 2: Miras kalma veri sistemini Büyük Veri Sistemi'ne adım adım geçiş prosedürü:
- Pratik Büyük Veri Geçiş Yolu anlayış
- Büyük Veri uygulaması tasarlama öncesi gerekli olan önemli bilgiler nelerdir
- Verinin hacmi, hızı, çeşitliliği ve doğruluğunu hesaplamanın farklı yolları nelerdir
- Veri büyümesini nasıl tahmin edebilirsiniz
- 2 Telco'da örnekle
5. Gün - Oturum 3 ve 4: Büyük Veri Tedarikçilerinin ve ürünlerinin gözden geçirilmesi. Soru-yanıt oturumu:
- AccentureAlcatel-Lucent
- Amazon -A9
- APTEAN (Eski CDC Software)
- Cisco Systems
- Cloudera
- Dell
- EMC
- GoodData Corporation
- Guavus
- Hitachi Data Systems
- Hortonworks
- Huawei
- HP
- IBM
- Informatica
- Intel
- Jaspersoft
- Microsoft
- MongoDB (Eski 10Gen)
- MU Sigma
- Netapp
- Opera Solutions
- Oracle
- Pentaho
- Platfora
- Qliktech
- Quantum
- Rackspace
- Revolution Analytics
- Salesforce
- SAP
- SAS Institute
- Sisense
- Software AG/Terracotta
- Soft10 Automation
- Splunk
- Sqrrl
- Supermicro
- Tableau Software
- Teradata
- Think Big Analytics
- Tidemark Systems
- VMware (EMC'nin bir parçası)
Kurs İçin Gerekli Önbilgiler
- Telkom sektöründeki iş operasyonları ve veri sistemleri hakkında temel bilgi sahibi olmalı
- SQL/Oracle veya ilişkisel veritabanı hakkında temel anlayışa sahip olmalı
- İstatistik (Excel düzeyinde) hakkında temel bir anlayışa sahip olmalı
Danışanlarımızın Yorumları (3)
Kullanılan tüm örnekler ve anlatım tarzı başlangıç seviyesindeki biri için de tam olarak yerindeydi. Anlamakta herhangi bir sorun yaşamadım ve eğitim çok sabırlıydı. Yardımına ihtiyaç duygunda her zaman ekstra bir adım atmak için hazırdı.
Mathipa Chepape - Vodacom
Eğitim - Big Data Business Intelligence for Telecom and Communication Service Providers
Yapay Zeka Çevirisi
Kullanılan tüm örnekler ve anlatım tarzı başlangıç seviyesindeki biri için de nettiydi. Anlamakta herhangi bir sorun yaşamadım ve eğitim veren kişi çok sabırlıydı. Yardımına ihtiyaç duygunda her zaman ekstra bir adım attı.
Mathipa Chepape - Vodacom
Eğitim - Big Data Business Intelligence for Telecom and Communication Service Providers
Yapay Zeka Çevirisi
Büyük veriyi daha iyi anlamak
Shaune Dennis - Vodacom
Eğitim - Big Data Business Intelligence for Telecom and Communication Service Providers
Yapay Zeka Çevirisi