Eğitim İçeriği

Performans Kavramları ve Ölçümler

  • Gecikme süresi, kapasite, güç kullanımını, kaynak kullanımını
  • Sistem karşılaştırmalarında model düzeyinde yavaşı
  • Tahminle eğitim için profil oluşturma

Huawei Ascend üzerinde Profil Oluşturma

  • CANN Profiler ve MindInsight kullanımı
  • Kernel ve operatöragnostik
  • Aşırı yükleme desenleri ve bellek eşleme

Biren GPU üzerinde Profil Oluşturma

  • Biren SDK performans izleme özellikleri
  • Kernel birleştirimi, hafıza uyumunu ve yürütme kuyrukları
  • Güç ve sıcaklık bilinci olan profil oluşturma

Cambricon MLU üzerinde Profil Oluşturma

  • BANGPy ve Neuware performans araçları
  • Kernel düzeyinde görünürlük ve günlük yorumlama
  • MLU analiztoolunun dağıtım çatılarıyla entegrasyonu

Çizge ve Model Düzeyi Optimizasyonu

  • Çizge kesme ve nicelendirme stratejileri
  • Operatör birleştirimi ve hesaplamalı çizge yeniden yapılandırma
  • Girdi boyutu standartlaştırma ve toplu ayarlama

Bellek ve Kernel Optimizasyonu

  • Bellek düzenini ve yeniden kullanılmasını iyileştirme
  • Chipsetler arasında verimli bufer yönetimi
  • Platforma göre kernel düzeyinde ayarlama teknikleri

Karışık Platform İyi Uygulamaları

  • Performans taşınabilirliği: soyutlama stratejileri
  • Birçok chipset ortamında paylaşılan ayarlama pipeline'ları oluşturma
  • Örnek: Ascend, Biren ve MLU arasında bir nesne tanıma modelini ayarlama

Özet ve Sonraki Adımlar

Kurs İçin Gerekli Önbilgiler

  • AI model eğitim veya dağıtım pipeline'larında工作经验与AI模型训练或部署管道
  • GPU/MLU计算原理和模型优化的理解
  • 性能剖析工具和指标的基本熟悉

受众

  • 性能工程师
  • 机器学习基础设施团队
  • AI系统架构师
 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Yaklaşan Etkinlikler

İlgili Kategoriler