Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Vue d'ensemble des capacités d'optimisation de CANN
- Gestion des performances d'inférence dans CANN
- Objectifs d'optimisation pour les systèmes IA edge et embarqués
- Compréhension de l'utilisation du cœur IA et de l'allocation mémoire
Utilisation du moteur de graphes pour l'analyse
- Introduction au moteur de graphes et au pipeline d'exécution
- Visualisation des graphes d'opérateurs et des métriques d'exécution
- Modification des graphes de calcul pour l'optimisation
Outils de profilage et métriques de performance
- Utilisation de l'outil de profilage CANN (profiler) pour l'analyse de charge de travail
- Analyse du temps d'exécution des noyaux et des goulets d'étranglement
- Profilage de l'accès mémoire et stratégies de tuilage
Développement d'opérateurs personnalisés avec TIK
- Vue d'ensemble de TIK et du modèle de programmation d'opérateurs
- Mise en œuvre d'un opérateur personnalisé à l'aide de la DSL de TIK
- Test et benchmark des performances de l'opérateur
Optimisation avancée des opérateurs avec TVM
- Introduction à l'intégration de TVM avec CANN
- Stratégies de réglage automatique pour les graphes de calcul
- Quand et comment basculer entre TVM et TIK
Techniques d'optimisation mémoire
- Gestion de la disposition mémoire et de l'emplacement des tampons
- Techniques pour réduire la consommation de mémoire sur puce
- Meilleures pratiques pour l'exécution asynchrone et la réutilisation
Déploiement en monde réel et études de cas
- Étude de cas : réglage des performances pour un pipeline de caméra de ville intelligente
- Étude de cas : optimisation de la pile d'inférence pour véhicule autonome
- Directives pour le profilage itératif et l'amélioration continue
Résumé et prochaines étapes
Pré requis
- Bonne compréhension des architectures de modèles d'apprentissage profond et des workflows d'entraînement
- Expérience du déploiement de modèles avec CANN, TensorFlow ou PyTorch
- Maîtrise de l'interface de ligne de commande Linux, de la programmation shell et de Python
Public cible
- Ingénieurs des performances IA
- Spécialistes de l'optimisation de l'inférence
- Développeurs travaillant sur l'IA边缘 (edge AI) ou les systèmes temps réel
14 Heures