Prenez contact avec nous

Plan du cours

Vue d'ensemble des capacités d'optimisation de CANN

  • Gestion des performances d'inférence dans CANN
  • Objectifs d'optimisation pour les systèmes IA edge et embarqués
  • Compréhension de l'utilisation du cœur IA et de l'allocation mémoire

Utilisation du moteur de graphes pour l'analyse

  • Introduction au moteur de graphes et au pipeline d'exécution
  • Visualisation des graphes d'opérateurs et des métriques d'exécution
  • Modification des graphes de calcul pour l'optimisation

Outils de profilage et métriques de performance

  • Utilisation de l'outil de profilage CANN (profiler) pour l'analyse de charge de travail
  • Analyse du temps d'exécution des noyaux et des goulets d'étranglement
  • Profilage de l'accès mémoire et stratégies de tuilage

Développement d'opérateurs personnalisés avec TIK

  • Vue d'ensemble de TIK et du modèle de programmation d'opérateurs
  • Mise en œuvre d'un opérateur personnalisé à l'aide de la DSL de TIK
  • Test et benchmark des performances de l'opérateur

Optimisation avancée des opérateurs avec TVM

  • Introduction à l'intégration de TVM avec CANN
  • Stratégies de réglage automatique pour les graphes de calcul
  • Quand et comment basculer entre TVM et TIK

Techniques d'optimisation mémoire

  • Gestion de la disposition mémoire et de l'emplacement des tampons
  • Techniques pour réduire la consommation de mémoire sur puce
  • Meilleures pratiques pour l'exécution asynchrone et la réutilisation

Déploiement en monde réel et études de cas

  • Étude de cas : réglage des performances pour un pipeline de caméra de ville intelligente
  • Étude de cas : optimisation de la pile d'inférence pour véhicule autonome
  • Directives pour le profilage itératif et l'amélioration continue

Résumé et prochaines étapes

Pré requis

  • Bonne compréhension des architectures de modèles d'apprentissage profond et des workflows d'entraînement
  • Expérience du déploiement de modèles avec CANN, TensorFlow ou PyTorch
  • Maîtrise de l'interface de ligne de commande Linux, de la programmation shell et de Python

Public cible

  • Ingénieurs des performances IA
  • Spécialistes de l'optimisation de l'inférence
  • Développeurs travaillant sur l'IA边缘 (edge AI) ou les systèmes temps réel
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires