Plan du cours

Introduction à Huawei CloudMatrix

  • Écosystème de CloudMatrix et flux de déploiement
  • Modèles, formats et modes de déploiement pris en charge
  • Cas d'utilisation typiques et puce compatible

Préparation des Modèles pour le Déploiement

  • Exportation des modèles à partir des outils de formation (MindSpore, TensorFlow, PyTorch)
  • Utilisation d'ATC (Ascend Tensor Compiler) pour la conversion de format
  • Modèles en forme statique vs dynamique

Déploiement sur CloudMatrix

  • Création des services et inscription du modèle
  • Déploiement des services d'inférence via l'IU ou la CLI
  • Routing, authentification et contrôle d'accès

Servir les Demandes d'Inférence

  • Flots d'inférence par lots vs en temps réel
  • Pipelines de prétraitement et post-traitement des données
  • Appels aux services CloudMatrix à partir d'applications externes

Surveillance et Réglage des Performances

  • Journaux de déploiement et suivi des demandes
  • Mise à l'échelle des ressources et équilibrage de charge
  • Réglages du délai de réponse et optimisation du débit

Intégration avec les Outils d'Entreprise

  • Connexion de CloudMatrix à OBS et ModelArts
  • Utilisation des workflows et versionnement des modèles
  • CI/CD pour le déploiement et la réversion du modèle

Pipeline d'Inférence de bout en bout

  • Déploiement d'un pipeline complet de classification d'images
  • Benchmarking et validation de précision
  • Simulation des changements de direction et alertes du système

Récapitulation et Étapes Suivantes

Pré requis

  • Une compréhension des workflows de formation des modèles AI
  • Expérience avec les frameworks ML basés sur Python
  • Familiarité de base avec les concepts de déploiement cloud

Public cible

  • Équipes d'opérations AI
  • Ingénieurs en apprentissage automatique
  • Spécialistes du déploiement cloud travaillant avec l'infrastructure Huawei
 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires