GPU Programlama - OpenCL vs CUDA vs ROCm Eğitimi
GPU programlama, yüksek performanslı hesaplama gerektiren uygulamaları hızlandırmak için GPUnun paralel işlem yeteneğini kullanma tekniğidir. Bu uygulamalara yapay zeka, oyunlar, grafik ve bilimsel hesaplama dahil olabilir. GPU programlamayı mümkün kılan birkaç çerçeve vardır; her birinin kendi avantajları ve dezavantajları vardır. OpenCL, farklı üreticilerden gelen CPU'lar, GPU'lar ve diğer cihazlar için kullanılabilen açık bir standarttır, CUDA ise NVIDIA GPU'lara özgüdür. ROCm, AMD GPU'lar üzerinde GPU programlamayı destekleyen bir platformdur ve aynı zamanda CUDA ve OpenCL ile uyumluluğu sağlar.
Bu eğitmen-dirigesi, canlı eğitim (çevrimiçi veya yerinde) başlangıç seviyesine sahip orta düzeyli geliştiriciler hedef almaktadır. Katılımcılar farklı çerçeveleri kullanarak GPU programlaması yapmayı ve özelliklerini, performansını ve uyumluluğunu karşılaştırmayı öğrenmek isterse uygundur.
Bu eğitim sonunda katılımcılar şunları yapabilecek olacaklar:
- OpenCL SDK, CUDA Toolkit, ROCm Platform, OpenCL, CUDA veya ROCm destekleyen bir cihaz ve Visual Studio Code dahil olmak üzere geliştirme ortamını ayarlamak.
- OpenCL, CUDA ve ROCm kullanarak vektör toplama yapan temel bir GPU programı oluşturmak ve her frameworkün sözdizimini, yapısını ve yürütümünü karşılaştırmak.
- Cihaz bilgilerini sorgulamak, cihaz hafızasını ayırıp geri almak, veriyi ana bilgisayar ve cihaz arasında kopyalamak, çekirdeği başlatmak ve iş parçacıklarını senkronize etmek için karşılık gelen API'leri kullanmak.
- Cihazda yürütülerek veriyi manipüle eden çekirdeklere karşılık gelen dilleri yazmak.
- Sık kullanılan görevleri ve işlemlerini gerçekleştirmek için karşılık gelen yerleşik fonksiyonları, değişkenleri ve kütüphaneleri kullanmak.
- Veri aktarımını ve hafıza erişimini optimize etmek için genel, yerel, sabit ve özel gibi karşıılık gelen bellek alanlarını kullanmak.
- Paralelliyi tanımlayan iş parçacıklarını, blokları veızleçleri kontrol etmek için karşılık gelen yürütme modellerini kullanmak.
- CodeXL, CUDA-GDB, CUDA-MEMCHECK ve NVIDIA Nsight gibi araçlar kullanarak GPU programlarını hata ayıklamak ve test etmek.
- GPU programlarını birleştirerek, önbellekleme, önalma ve profil oluşturma tekniklerini kullanarak optimize etmek.
Kurs Formatı
- Etkileşimli ders ve tartışma.
- Çoğu alıştırma ve pratik.
- Canlı-lab ortamında elden geçirme uygulaması.
- Bu kurs için özelleştirilmiş bir eğitim talep etmek istiyorsanız, lütfen bizimle iletişime geçin.
- C/C++ dilini ve paralel programlama kavramlarını anlamak
Kurs Özelleştirme Seçenekleri
Bilgisayar mimarisini ve hafıza hiyerarjisini temel bilgi sahibi olmak
Hedef Kitle
Eğitim İçeriği
Giriş
- GPU programlama nedir?
- Neden GPU programlamasını kullanmalıyız?
- GPU programlaması için sorunlar ve trade-off'ları nelerdir?
- GPU programlama için frameworkler nelerdir?
- Uygulamanıza uygun framework seçimi
OpenCL
- OpenCL nedir?
- OpenCL'nin avantajları ve dezavantajları nelerdir?
- OpenCL için geliştirme ortamını ayarlama
- Vektör toplama işlemi yapan temel bir OpenCL programı oluşturma
- Cihaz bilgisi sorgulama, cihaz belleği tahsis etme ve tahsisi kaldırma, ana makine ile cihaz arasındaki veriyi kopyalama, çekirdekleri başlatma ve iş parçacıklarını senkronizasyonu yapmak için OpenCL API'sini kullanma
- Ana makinede çalıştırılan ve veriyi işlemeyi sağlayan çekirdeklerin yazılması için OpenCL C dilini kullanma
- Ortak görevler ve işlemleri gerçekleştirmek için OpenCL'nin dahili fonksiyonları, değişkenleri ve kütüphanelerini kullanma
- Global, yerel, sabit ve özel gibi OpenCL bellek alanlarını kullanarak veri transferlerini ve bellek erişimlerini optimize etme
- İş öğelerini, iş gruplarını ve ND aralıklarını tanımlayan paralellik kontrolü için OpenCL'nin yürütme modelini kullanma
- CodeXL gibi araçlarla OpenCL programlarını hata ayıklama ve test etme
- Birleştirme, önbelleğe alma, önceden yükleme ve profil oluşturma gibi teknikler kullanarak OpenCL programlarını optimize etme
CUDA
- CUDA nedir?
- CUDA'nın avantajları ve dezavantajları nelerdir?
- CUDA için geliştirme ortamını ayarlama
- Vektör toplama işlemi yapan temel bir CUDA programı oluşturma
- Cihaz bilgisi sorgulama, cihaz belleği tahsis etme ve tahsisi kaldırma, ana makine ile cihaz arasındaki veriyi kopyalama, çekirdekleri başlatma ve iş parçacıklarını senkronizasyonu yapmak için CUDA API'sini kullanma
- Ana makinede çalıştırılan ve veriyi işlemeyi sağlayan çekirdeklerin yazılması için CUDA C/C++ dilini kullanma
- Ortak görevler ve işlemleri gerçekleştirmek için CUDA'nın dahili fonksiyonlarını, değişkenlerini ve kütüphanelerini kullanma
- Global, paylaşılan, sabit ve yerel gibi CUDA bellek alanlarını kullanarak veri transferlerini ve bellek erişimlerini optimize etme
- İş parçacıklarını, blokları ve gridleri tanımlayan paralellik kontrolü için CUDA'nın yürütme modelini kullanma
- CUDA-GDB, CUDA-MEMCHECK ve NVIDIA Nsight gibi araçlarla CUDA programlarını hata ayıklama ve test etme
- Birleştirme, önbelleğe alma, önceden yükleme ve profil oluşturma gibi teknikler kullanarak CUDA programlarını optimize etme
ROCm
- ROCm nedir?
- ROCm'nin avantajları ve dezavantajları nelerdir?
- ROCm için geliştirme ortamını ayarlama
- Vektör toplama işlemi yapan temel bir ROCm programı oluşturma
- Cihaz bilgisi sorgulama, cihaz belleği tahsis etme ve tahsisi kaldırma, ana makine ile cihaz arasındaki veriyi kopyalama, çekirdekleri başlatma ve iş parçacıklarını senkronizasyonu yapmak için ROCm API'sini kullanma
- Ana makinede çalıştırılan ve veriyi işlemeyi sağlayan çekirdeklerin yazılması için ROCm C/C++ dilini kullanma
- Ortak görevler ve işlemleri gerçekleştirmek için ROCm'nın dahili fonksiyonlarını, değişkenlerini ve kütüphanelerini kullanma
- Global, yerel, sabit ve özel gibi ROCm bellek alanlarını kullanarak veri transferlerini ve bellek erişimlerini optimize etme
- İş parçacıklarını, blokları ve gridleri tanımlayan paralellik kontrolü için ROCm'nın yürütme modelini kullanma
- ROCm Debugger ve ROCm Profiler gibi araçlarla ROCm programlarını hata ayıklama ve test etme
- Birleştirme, önbelleğe alma, önceden yükleme ve profil oluşturma gibi teknikler kullanarak ROCm programlarını optimize etme
Karşılaştırma
- OpenCL, CUDA ve ROCm'nin özelliklerini, performansını ve uyumluluğunu karşılaştırma
- GPU programlarını benchmarcler ve metrikler kullanarak değerlendirme
- GPU programlaması için en iyi uygulamaları ve ipuçlarını öğrenme
- GPU programlamasının güncel ve gelecekteki trendleri ve zorluklarını keşfetme
Özeti ve Son Adımlar
Kurs İçin Gerekli Önbilgiler
- C/C++ dili ve paralel programlama kavramları üzerine bilgi sahibi olmak
- Bilgisayar mimarisi ve bellek hiyerarşısı konusundaki temel bilgiler
- Komut satırı araçları ve kod düzenleyicilerle deneyim kazanmış olmak
Hedef Kitle
- Farklı çerçeveleri kullanmayı öğrenmek ve özelliklerini, performansını ve uyumluluğunu karşılaştırmak isteyen geliştiriciler
- Farklı platformlarda ve cihazlarda çalışabilen taşınabilir ve ölçeklenebilir kod yazmayı öğrenmek isteyen geliştiriciler
- GPU programlaması ve optimizasyonu konusundaki maliyet-benefit analizi ve zorlukları keşfetmeyi öğrenmek isteyen programcılar
Açık Eğitim Kursları 5 ve üzeri katılımcı gerektirir.
GPU Programlama - OpenCL vs CUDA vs ROCm Eğitimi - Rezervasyon
GPU Programlama - OpenCL vs CUDA vs ROCm Eğitimi - Talep Oluştur
GPU Programlama - OpenCL vs CUDA vs ROCm - Danışmanlık Talebi
Danışmanlık Talebi
Yaklaşan Etkinlikler
İlgili Kurslar
[Aİ Uygulamalarının Huawei Ascend ve CANN ile Geliştirilmesi]
21 SaatHuawei Ascend, yüksek performanslı推理和训练的人工智能处理器系列。
这个由讲师指导的实时培训(在线或现场)面向中级AI工程师和数据科学家,他们希望使用华为Ascend平台和CANN工具包开发和优化神经网络模型。
完成本培训后,参与者将能够:
- 设置并配置CANN开发环境。
- 使用MindSpore和CloudMatrix工作流开发AI应用程序。
- 通过自定义操作符和瓦片优化Ascend NPU上的性能。
- 将模型部署到边缘或云环境。
课程格式
- 互动讲座和讨论。
- 在示例应用程序中实际使用Huawei Ascend和CANN工具包。
- 关注模型构建、训练和部署的指导练习。
课程定制选项
- 如需根据您的基础设施或数据集请求此课程的定制培训,请联系我们安排。
AI Modellerin CANN ve Ascend AI İşlemcileriyleploymentu
14 SaatCANN (Compute Architecture for Neural Networks) Huawei'nin AI modelini Ascend AI işlemcilerine dağıtmak ve optimize etmek için kullanılan AI hesaplama stöküdür.
Bu eğitmen tarafından yönetilen canlı eğitim (online veya on-site), eğitimli AI modellerini etkili bir şekilde Huawei Ascend donanımına dağıtma amacıyla CANN kiti ve MindSpore, TensorFlow, veya PyTorch gibi araçları kullanmayı öğrenmek isteyen orta düzeyde AI geliştiricileri ve mühendisleri için tasarlanmıştır.
Bu eğitim sonunda katılımcılar aşağıdaki yetenekleri kazanacaklardır:
- CANN mimarisini ve AI dağıtım kanalındaki rolünü anlamak.
- Popüler çerçevelerden Ascend uyumlu biçimlere modeli dönüştürme ve uyarlamak.
- ATC, OM model dönüştürmesi ve MindSpore gibi araçları kullanmak (kenar ve bulut çıkarımında).
- Ascend donanımda dağıtım sorunlarını teşhis etmek ve performansı optimize etmek.
Eğitim Biçimi
- Etkileşimli ders anlatımı ve gösterim.
- CANN araçlarını ve Ascend simülatorlarını veya cihazlarını kullanarak el ile laboratuvar çalışması.
- Gerçek dünya AI modellerine dayalı uygulamaların örnekleri.
Eğitim Özelleştirme Seçenekleri
- Bu eğitimi özelleştirmek için özel bir eğitim talebinde bulunmak istiyorsanız, bize başvurarak düzenleme yapabilirsiniz.
GPU Programming Biren AI Akkolatörler
21 SaatBiren AI Accelerators, büyük ölçekli eğitim ve çıkarım için destek sağlayan, AI ve HPC iş yükleri için tasarlanmış yüksek performanslı GPUlerdir.
Bu eğitmen yönetimi altında yapılan canlı eğitim (çevrimiçi veya yerel) orta seviye ve ileri düzey geliştirmenin Biren'in özel GPU yığını kullanarak uygulamaları programlamak ve optimize etmek için tasarlanmıştır. CUDA tabanlı ortamlarla pratik karşılaştırmalarda bulunacaktır.
Bu eğitim sonunda katılımcılar şunları yapabilecektir:
- Biren GPU mimarisini ve bellek hiyerarşisini anlayacak.
- Geliştirme ortamını kurma ve Biren'in programlama modelini kullanma.
- CUDA tarzındaki kodu Biren platformlarına çevirmek ve optimize etmek.
- Performans ayarlama ve hata ayıklama tekniklerini uygulamak.
Eğitim Formatı
- Etkileşimli ders anlatımı ve tartışma.
- Örnek GPU iş yüklerinde Biren SDK'nın kullanımı.
- Taşıma ve performans ayarlama odaklanan yönlendirilmiş uygulamalar.
Eğitim Özelleştirme Seçenekleri
- Uygulama yığınına veya tümleştirmede ihtiyaçlarınıza dayalı olarak bu eğitim için özel bir eğitim talep etmek istiyorsanız, lütfen bizimle iletişime geçin.
Cambricon MLU Development with BANGPy and Neuware
21 SaatCambricon MLUs (Machine Learning Birimleri) kenar ve veri merkezi senaryolarında tahmin ve eğitim için optimize edilmiş özelleştirilmiş AI chip'leridir.
Bu eğitmen tarafından yönetilen canlı eğitim (çevrimiçi veya yerel), BANGPy framework'i ve Neuware SDK'yı Cambricon MLU donanımını kullanarak yapay zeka modelleri oluşturmak ve dağıtmak isteyen orta düzeyli geliştiricilere yöneliktir.
Bu eğitim sonunda, katılımcılar şunları yapabilecekler:
- BANGPy ve Neuware geliştirme ortamlarını kurma ve yapılandırma.
- Cambricon MLU'lar için Python ve C++-tabanlı modelleri geliştirmek ve optimize etmek.
- Neuware runtime'u çalıştıran kenar ve veri merkezi cihazlarına model dağıtmak.
- MLU özel hızlandırma özelliklerini ML iş akışlarıyla entegre etmek.
Eğitim Formatı
- Interaktif ders anlatımı ve tartışmalar.
- BANGPy ve Neuware'ın geliştirme ve dağıtım için el ile kullanımı.
- Optimizasyon, entegrasyon ve test odaklı yönlendirilmiş egzersizler.
Eğitim Özelleştirme Seçenekleri
- Cambricon cihaz modelinize veya kullanım durumunuza dayalı bu eğitim için özelleştirilmiş bir eğitim talebinde bulunmak isterseniz, lütfen bizi düzenlemek üzere iletişime geçin.
Yapay Zeka Çerçevesi Geliştiriciler için CANN Giriş
7 SaatCANN (Compute Architecture for Neural Networks) Huawei'nin AI hesaplama araç seti, Ascend AI işlemcilerinde AI modellerini derleme, iyileştirme ve dağıtma amacıyla kullanılır.
Bu eğitmenler tarafından yönetilen canlı eğitim (çevrimiçi veya yerel), eğitimden dağıtımın tüm süreçleri için CANN'nin rolünü anlamayı ve MindSpore, TensorFlow ve PyTorch gibi çerçevelerle nasıl çalıştığını anlamak isteyen giriş seviyesinde AI geliştiricileri için tasarlanmıştır.
Bu eğitim sonunda katılımcılar şunları başarabilecekler:
- CANN araç setinin amacını ve mimarisini anlamak.
- CANN ile MindSpore ile geliştirme ortamını kurmak.
- Basit bir AI modelini Ascend donanımına dönüştürmek ve dağıtmak.
- Gelecekteki CANN iyileştirme veya entegrasyon projeleri için temel bilgi kazanmak.
Eğitim Formatı
- Etkileşimli ders ve tartışma.
- Basit model dağıtımını içeren elden deneyimler.
- CANN araç zinciri ve entegrasyon noktalarına adım adım kılavuzluk.
Eğitim Özelleştirme Seçenekleri
- Bu eğitim için özel bir eğitim talep etmek isterseniz lütfen bizimle iletişime geçin ve ayarlayın.
CANN için Edge AI dağıtımı
14 SaatHuawei'nin Ascend CANN araç seti, Ascend 310 gibi kenar cihazlarda güçlü AI çıkarımını sağlar. CANN, hesaplama ve bellek kısıtlı ortamlarda modellerin derlenmesi, optimize edilmesi ve dağıtımı için temel araçları sunar.
Bu eğitmen tarzı canlı eğitim (online veya face-to-face) orta düzeyli AI geliştiricilerine ve entegre etmecilere yöneliktir. Bu kişiler, Ascend kenar cihazlarında CANN araç zinciri kullanarak modeli dağıtmayı ve optimize etmek isteyenlerdir.
Bu eğitim sonunda katılımcılar şunları yapabilecek hale gelecek:
- Ascend 310 için AI modellerini hazırlayın ve CANN araçlarıyla dönüştürün.
- MindSpore Lite ve AscendCL kullanarak hafif çıkarım pipeline'larını oluşturun.
- Sınırlı hesaplama ve bellek ortamları için model performansını optimize edin.
- Gerçek dünya kenar kullanım durumlarında AI uygulamalarını dağıtın ve izleyin.
Eğitim Formatı
- Etkileşimli ders anlatımı ve gösteri.
- Kenara özel modeller ve senaryolarla el ile laboratuvar çalışmaları.
- Sanal veya fiziksel kenar donanımda canlı dağıtım örnekleri.
Eğitim Özelleştirme Seçenekleri
- Bu eğitim için özel bir eğitim talep etmek için bize başvurunuz.
Huawei’nin AI Hesaplama Katmanını Anlamak: CANN’den MindSpore’a
14 SaatHuawei'nin AI yapısı — düşük seviyeli CANN SDK'dan yüksek seviyeli MindSpore çatısı'na kadar — Ascend donanımına en uygun şekilde entegre edilmiş bir AI geliştirme ve dağıtım ortamı sunar.
Bu eğitmen yönetimi altında gerçekleşen canlı eğitim (çevrimiçi veya yerel olarak) temel düzeyden ileri düzey teknik uzmanları hedef alır ve CANN ile MindSpore bileşenlerinin AI yaşam döngüsü yönetimi ve donanım kararlarını destekleme şekli hakkında daha fazla bilgi edinmek isteyenleri kapsar.
Bu eğitim sonunda, katılımcılar şunları başarabilecekler:
- Huawei'nin AI hesaplama yapısının katmanlı mimarisini anlamak.
- CANN'nin model optimizasyonu ve donanım seviyesi dağıtımını nasıl desteklediği belirlenmesi.
- Endüstri alternatifleri ile ilişkilendirilmiş olarak MindSpore çatısı ve araç zinciri'nin değerlendirilmesi.
- Huawei'nin AI yapısının kurumsal veya bulut/yerel ortamlardaki konumunu belirlemek.
Eğitim Formatı
- Etkileşimli ders ve tartışma.
- Canlı sistem demo'ları ve durum tabanlı walkthrough'lar.
- MindSpore'dan CANN'ye model akışı hakkında yönlendirilmiş laboratuvar seçenekleri.
Eğitim Özelleştirme Seçenekleri
- Bu kurs için özelleştirilmiş bir eğitim talep etmek istiyorsanız, lütfen bize iletişime geçin.
Neuronal Ağ Performansını CANN SDK ile Optimizasyon
14 SaatCANN SDK (Compute Architecture for Neural Networks) Huawei'nın AI hesaplama temelidir ve geliştiricilerin Ascend AI işlemcilerinde dağıtılan sinir ağlarının performansını ayarlamalarına ve optimize etmelerine olanak sağlar.
Bu eğitmen yönetilen canlı eğitim (çevrimiçi veya yerel), tahmin performansını CANN'nin gelişmiş araç seti, Graph Engine, TIK ve özel operatör geliştirme kullanarak optimize etmek isteyen uzman düzeyde AI geliştiricileri ve sistem mühendisleri için tasarlanmıştır.
Eğitim sonunda katılımcılar şunları yapabilecektir:
- CANN'nin çalışma zamanı mimarisini ve performans yaşam döngüsünü anlayacaklar.
- Performans analizi ve optimizasyonu için profil oluşturma araçlarını ve Graph Engine'i kullanacaklar.
- TIK ve TVM ile özel operatörler oluşturmayı ve optimize edecekler.
- Bellek daralıklarını çözecek ve model akışını artıracaklar.
Eğitim Formatı
- Interaktif ders ve tartışma.
- Gerçek zamanlı profil oluşturma ve operatör ayarı ile elden deneme laboratuvarları.
- Kıyısı durum dağıtım örnekleri kullanarak optimizasyon egzersizi.
Eğitim Özelleştirme Seçenekleri
- Bu eğitim için özel bir eğitim talep etmek istiyorsanız, bize ulaşın ve düzenleme yapın.
CANN SDK için Bilgisayar Görüşü ve Doğal Dil İşleme Hatları
14 SaatCANN SDK (Neural Ağlar için Hesaplama Mimarisi) bilgisayar görüşü ve doğal dil işleme (NLP) alanında gerçek zamanlı AI uygulamaları için, özellikle Huawei Ascend donanımı üzerinde güçlü dağıtım ve optimizasyon araçları sağlar.
Bu eğitmen öncülünde, canlı eğitim (online veya yerinde), orta seviye AI uzmanlarının CANN SDK'yı kullanarak üretim kullanım senaryoları için görsel ve dil modelleri oluşturmak, dağıtmak ve optimiz etmek isteyenler için düzenlenmiştir.
Bu eğitimin sonunda katılımciler şunları yapabilecektir:
- CANN ve AscendCL kullanarak CV ve NLP modellerini dağıtmak ve optimiz etmek.
- CANN araçlarını kullanarak modelleri dönüştürmek ve canlı hatlara entegre etmek.
- Tespit, sınıflandırma ve duygu analizi gibi görevler için çıkarım performansını optimiz etmek.
- Kenar veya bulut tabanlı dağıtım senaryoları için gerçek zamanlı CV/NLP hatları oluşturmak.
Eğitim Biçimi
- Etkileşimli ders ve gösteri.
- Model dağıtım ve performans profillemesi ile elden deneme labı.
- Gerçek CV ve NLP kullanım senaryoları kullanarak canlı hat tasarım.
Eğitim Özelleştirme Seçenekleri
- Bu eğitimin özelleştirilmiş bir versiyonunu talep etmek için lütfen bizimle iletişime geçin.
Özelleştirilmiş AI Operatörlerini CANN TIK ve TVM ile Geliştirmek
14 SaatCANN TIK (Tensor Instruction Kernel) ve Apache TVM, Huawei Ascend donanıma yönelik AI model işlemcilerinin ileri düzeyde optimizasyonu ve özelleştirilmesini sağlar.
Bu eğitmen tarafından yönetilen canlı eğitim (önline veya onsite), AI modelleri için özel işlemciler oluşturmak, dağıtmak ve ayarlamak isteyen ileri seviye sistem geliştiricilerine yönelik olup CANN'nin TIK programlama modelini ve TVM derleyici entegrasyonunu kullanır.
Bu eğitim sonunda katılımcılar şunları yapabilecektir:
- Ascend işlemcileri için TIK DSL ile özel AI işlemlerini yazıp test etme.
- Özel işlemleri CANN çalışma zamanına ve yürütme grafiğine entegrasyon.
- TVM'yi işlem planlaması, otomatik ayarlaması ve benchmarklemesi için kullanma.
- Özel hesaplama desenlerinin talimat düzeyi performansını hata ayıklamak ve optimize etmek.
Eğitim Formatı
- Etkileşimli ders anlatımı ve gösterim.
- TIK ve TVM pipeline'larını kullanarak işlemcilerin kodlanması.
- Ascend donanımlarında veya simülatorlarda test etme ve ayarlama.
Eğitim Özelleştirme Seçenekleri
- Bu eğitim için özelleştirilmiş bir eğitim talebinde bulunmak istiyorsanız, lütfen bizimle iletişime geçin.
CUDA Uygulamalarını Çince GPU Mimarilere Taşıma
21 SaatÇin GPU mimarileri, Huawei Ascend, Biren ve Cambricon MLU gibi alternatif CUDA seçenekleri sunarak yerel AI ve HPC pazarlarına hizmet ediyor.
Bu eğitmen yönetimi altında gerçekleşen canlı eğitim (online veya face-to-face) ileri düzey GPU programcıları ve altyapı uzmanlarını hedefleyerek mevcut CUDA uygulamalarını Çin donanım platformlarına taşımayı ve optimize etmeyi amaçlıyor.
Eğitim sonunda katılımcılar:
- Mevcut CUDA iş yüklerinin Çin alternatifCHIP'leriyle uyumunu değerlendirecekler.
- CUDA kod tabanlarını Huawei CANN, Biren SDK ve Cambricon BANGPy ortamlarına taşıyacaklar.
- Performansı karşılaştıracak ve platformlar arası optimizasyon noktalarını belirleyecekler.
- Multiplesimya destek ve dağıtımda praktik zorlukları ele alacaklar.
Eğitim Formatı
- Interaktif ders ve tartışmalar.
- Kod çevirme ve performans karşılaştırmalı laboratuvarları.
- Birden çok-GPU uyum stratejilerine odaklanan yönlendirilmiş egzersizler.
Eğitim Özelleştirme Seçenekleri
- Platformanız veya CUDA projesi için bu eğitimi özelleştirmek isterseniz, lütfen bize ulaşın ve düzenleme yapın.
Performance Optimization on Ascend, Biren, and Cambricon
21 SaatAscend, Biren ve Cambricon, Çin'deki önde gelen AI donanım platformlarıdır ve her biri üretim ölçekteki AI yüklemeleri için benzersiz hızlandırma ve profilleme araçları sunar.
Bu eğitmen tarafından yönetilen canlı eğitim (çevrimiçi veya yerel), çoklu Çin AI chip platformlarında model çıkarımı ve eğitim akışlarını optimize etmek isteyen ileri düzey AI altyapı ve performans mühendisleri için tasarlanmıştır.
Eğitim sonunda katılımcılar şunları yapabilecektir:
- Ascend, Biren ve Cambricon platformlarında modelleri test etmek.
- Sistem zorluk noktalarını ve bellek/hesaplama verimlilik eksikliklerini belirlemek.
- Çizelge seviyesinde, çekirdek seviyesinde ve operatör seviyesinde optimizasyonlar uygulamak.
- Toplamı ve gecikmeyi iyileştirmek için dağıtım boru hattlarını ayarlamak.
Eğitim Formatı
- Aktif ders anlatımı ve tartışma.
- Her platformda profilleme ve optimizasyon araçlarının uygulanması.
- Pratik ayar senaryolarına odaklanan yönlendirilmiş egzersizler.
Eğitim Özelleştirme Seçenekleri
- Sunum ortamınız veya model tipinize dayalı olarak bu eğitim için özelleştirilmiş bir eğitim talep etmek istiyorsanız, lütfen bizi düzenlemek üzere iletişime geçiniz.