Prenez contact avec nous

Plan du cours

Introduction

Compréhension des fondamentaux de la méthodologie de calcul hétérogène

Pourquoi le calcul parallèle ? Comprendre la nécessité du calcul parallèle

Processeurs multi-cœurs - Architecture et conception

Introduction aux threads, bases des threads et concepts fondamentaux de la programmation parallèle

Compréhension des fondamentaux des processus d'optimisation logicielle GPU

OpenMP - Une norme pour la programmation parallèle basée sur des directives

Pratique / Démonstration de divers programmes sur des machines multicœurs

Introduction au calcul GPU

GPU pour le calcul parallèle

Modèle de programmation GPU

Pratique / Démonstration de divers programmes sur GPU

SDK, kit de développement et installation de l'environnement pour GPU

Travail avec diverses bibliothèques

Démonstration de GPU et d'outils avec des programmes exemples et OpenACC

Compréhension du modèle de programmation CUDA

Apprentissage de l'architecture CUDA

Exploration et configuration des environnements de développement CUDA

Travail avec l'API runtime CUDA

Compréhension du modèle de mémoire CUDA

Exploration des fonctionnalités supplémentaires de l'API CUDA

Accès efficace à la mémoire globale dans CUDA : optimisation de la mémoire globale

Optimisation des transferts de données dans CUDA à l'aide des flux CUDA

Utilisation de la mémoire partagée dans CUDA

Compréhension et utilisation des opérations atomiques et des instructions dans CUDA

Étude de cas : traitement d'image numérique de base avec CUDA

Programmation multi-GPU

Profilage et échantillonnage avancés du matériel sur NVIDIA / CUDA

Utilisation de l'API CUDA Dynamic Parallelism pour le lancement dynamique de kernels

Résumé et conclusion

Pré requis

  • Programmation en C
  • Linux GCC
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires