Prenez contact avec nous

Plan du cours

Aperçu de l'écosystème GPU d'IA chinois

  • Comparaison entre Huawei Ascend, Biren et Cambricon MLU
  • Modèles CUDA vs CANN, Biren SDK et BANGPy
  • Tendances industrielles et écosystèmes fournisseurs

Préparation à la migration

  • Évaluation de votre base de code CUDA
  • Identification des plateformes cibles et des versions du SDK
  • Installation de la chaîne d'outils et configuration de l'environnement

Techniques de traduction de code

  • Portage de l'accès à la mémoire CUDA et de la logique des noyaux
  • Cartographie des modèles de grille de calcul et de threads
  • Solutions de traduction automatisées versus manuelles

Implémentations spécifiques à la plateforme

  • Utilisation des opérateurs et noyaux personnalisés de Huawei CANN
  • Pipeline de conversion du SDK Biren
  • Reconstruction des modèles avec BANGPy (Cambricon)

Tests et optimisation interplateformes

  • Profilage de l'exécution sur chaque plateforme cible
  • Optimisation de la mémoire et comparaison de l'exécution parallèle
  • Suivi des performances et itérations

Gestion des environnements GPU mixtes

  • Déploiements hybrides avec plusieurs architectures
  • Stratégies de repli et détection des périphériques
  • Couches d'abstraction pour la maintenabilité du code

Études de cas et bonnes pratiques

  • Portage de modèles de vision/traitement du langage naturel (NLP) vers Ascend ou Cambricon
  • Adaptation des pipelines d'inférence sur les clusters Biren
  • Gestion des écarts de versions et des lacunes API

Résumé et prochaines étapes

Pré requis

  • Expérience en programmation CUDA ou en applications basées sur le GPU
  • Compréhension des modèles de mémoire GPU et des noyaux de calcul
  • Maîtrise des workflows de déploiement ou d'accélération de modèles d'IA

Public visé

  • Programmeurs GPU
  • Architectes systèmes
  • Spécialistes en portage
 21 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires