Plan du cours

Introduction à Cambricon et à l'architecture MLU

  • Aperçu de la gamme de puces AI de Cambricon
  • Architecture MLU et pipeline d'instructions
  • Types de modèles pris en charge et cas d'utilisation

Installation du chaînage de développement

  • Installation de BANGPy et de la SDK Neuware
  • Configuration de l'environnement pour Python et C++
  • Compatibilité des modèles et prétraitement

Développement de modèles avec BANGPy

  • Gestion de la structure et de la forme des tenseurs
  • Construction du graphe de calcul
  • Soutien aux opérations personnalisées dans BANGPy

Déploiement avec le runtime Neuware

  • Conversion et chargement des modèles
  • Contrôle d'exécution et d'inférence
  • Pratiques de déploiement aux bords et dans les centres de données

Optimisation des performances

  • Mappage mémoire et ajustement des couches
  • Suivi et profilage d'exécution
  • Bouchons courants et corrections

Intégration de MLU dans les applications

  • Utilisation des API Neuware pour l'intégration des applications
  • Support du streaming et des modèles multiples
  • Cas d'inférence hybride CPU-MLU

Projet de bout en bout et Use Case

  • Atelier : Déploiement d'un modèle de vision ou NLP
  • Inférence aux bords avec intégration BANGPy
  • Test de précision et de débit

Résumé et prochaines étapes

Pré requis

  • Une compréhension des structures de modèles d'apprentissage automatique
  • Expérience avec Python et/ou C++
  • Familiarité avec les concepts de déploiement et d'accélération des modèles

Public cible

  • Développeurs AI embarqués
  • Ingénieurs ML déployant sur le bord ou dans un centre de données
  • Développeurs travaillant avec l'infrastructure AI chinoise
 21 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires