Prenez contact avec nous

Plan du cours

Introduction à l'architecture GPU Biren

  • Vue d'ensemble de Biren et cas d'utilisation
  • Structure matérielle : cœurs, mémoire, clusters de calcul
  • Comparaison avec les GPU NVIDIA et AMD

Configuration de l'environnement de programmation Biren

  • Installation du SDK Biren et de l'environnement d'exécution
  • Compréhension de la chaîne d'outils et du modèle de compilateur
  • Structure de projet de base et processus de génération

Programmation GPU avec la pile Biren

  • Modèles de threads et de blocs
  • Gestion de la mémoire et transferts de données
  • Développement de noyaux et modèles de lancement

Migration de CUDA vers Biren

  • Techniques de traduction du code CUDA
  • Mappages et adaptations d'API courants
  • Laboratoires et pratique de la conversion de code

Débogage et profilage

  • Utilisation du débogueur et du profileur Biren
  • Identification des goulots d'étranglement
  • Modèles d'accès à la mémoire et optimisation

Techniques d'optimisation

  • Planification des threads et pipeline d'instructions
  • Déroulement de boucles et utilisation de la mémoire partagée
  • Réglage avancé des noyaux pour le débit

Étude de cas et exemples d'application

  • Entraînement d'un modèle avec les accélérateurs Biren
  • Migration et profilage d'un modèle de vision ou de traitement du langage naturel (NLP)
  • Comparaison des performances par rapport à CUDA/NVIDIA

Résumé et prochaines étapes

Pré requis

  • Une compréhension de l'architecture GPU et du traitement parallèle
  • Expérience avec CUDA, OpenCL ou des environnements de programmation GPU similaires
  • Familiarité avec des frameworks d'apprentissage profond tels que PyTorch ou TensorFlow

Public cible

  • Développeurs HPC
  • Ingénieurs en infrastructure IA
  • Spécialistes en optimisation des performances
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires