Que ce soit en ligne ou sur site, les cours de formation en direct animés par un instructeur sur le GPU (Unité de traitement graphique) démontrent, à travers des discussions interactives et des pratiques concrètes, les fondamentaux du GPU et les méthodes de programmation des GPU.
La formation GPU est disponible sous forme de « formation en direct en ligne » ou de « formation en direct sur site ». La formation en direct en ligne (également appelée « formation en direct à distance ») est dispensée via un bureau à distance interactif. La formation en direct sur site peut être réalisée localement sur vos sites dans Ontario ou dans nos centres de formation corporate de NobleProg à Ontario.
NobleProg -- Votre prestataire de formation local
London - London City Centre
380, rue Wellington, London, Canada, N6A 5B5
Le centre occupe le 6e étage du City Centre Building, un complexe d'angle idéalement situé au centre-ville de London, en Ontario.
West Toronto - Etobicoke
10 Four Seasons Place, Toronto, Canada, M9B 6H7
Etobicoke est un quartier prestigieux situé à l'ouest de Toronto, à mi-chemin entre Toronto et Mississauga. Facilement accessible par les transports en commun (bus) et à 5 minutes de la station de métro locale.
Scarborough – 10 Milner Business Court
10 Milner Business Court, Scarborough, Canada, M1B 3C6
Le Milner Court Centre occupe le troisième étage d'un immeuble d'angle. Il est facilement accessible par les transports en commun, que ce soit par autobus ou par le réseau de transport en commun rapide.
Oakville - Winston Park
2010, promenade Winston Park, Oakville, Canada, L6H 5R7
Le centre Winston Park est situé à proximité de la Queen Elizabeth Way et de l'Ontario 403, offrant un accès facile à Burlington et Hamilton à l'ouest et à Mississauga et Toronto à l'est.
Barrie - 49 High Street
49 rue High , Barrie, Canada, L4N 5J4
Équilibrez travail et loisirs dans nos bureaux situés au 49 High Street. Barrie possède un centre commercial animé et bénéficie d’une excellente connectivité – nos bureaux centraux se trouvent à seulement quelques minutes en voiture de l’autoroute 400
Maximisez les opportunités dans cette ville avant-gardiste, un centre de connaissances qui abrite plusieurs géants de la technologie. Notre centre bien desservi du 180 Northfield Drive West se trouve sur le campus d'entreprise de la ville, près de la prestigieuse Université de Waterloo.
Kitchener - 22, rue Frederick
22, rue Frederick, Kitchener, canada, N2H 6M6
Espace de bureau de premier plan au centre-ville
Établissez votre entreprise au cœur du centre-ville de Kitchener. Travaillez aux côtés de sociétés financières et d'assurances de premier plan dans nos bureaux du 22 Frederick Street, au coin de Frederick Street, vous offrant un accès facile aux commodités locales.
Brampton - 2 County Court
2 County Court Boulevard, Brampton, Canada, L6W 3W8
Tournez-vous vers l’avenir avec un espace de bureau au 2 County Court, un bâtiment aux performances environnementales exceptionnelles. La troisième plus grande ville du Grand Toronto bénéficie d’excellentes liaisons de transport, tandis que l’aéroport international de Toronto se trouve à moins de 16 km.
Richmond Hill - The Business Exchange
9225 Rue Leslie, Richmond Hill, Canada, L4B 3H6
Implantez votre entreprise dans le cadre paisible de Richmond Hill, qui abrite de grandes marques mondiales. Situé dans la banlieue nord, notre espace de travail The Business Exchange se trouve à seulement 30 minutes en voiture du centre de Toronto et de l'aéroport international.
Ottawa - Albert & Metcalfe
116, rue Albert, Ottawa, Canada, K1P 5G3
En face du World Exchange Plaza. Le Centre Shaw d'Ottawa et le centre commercial CF Rideau Centre sont à 10 minutes.
Barrie-49 Rue High
3ᵉ étage, Rue Dunlop Ouest, Barrie, Canada, L4N 1A8
Un Parfait Équilibre entre Travail et Loisirs au Bord du Lac Simcoe
Alliez productivité et détente dans notre espace de bureau situé au 49 High Street. Situé au cœur du centre commercial animé de Barrie, cet espace de travail bénéficie d'une excellente connectivité, avec l'autoroute 400 à quelques minutes en voiture.
Travaillez efficacement dans un bâtiment en brique moderne avec une entrée vitrée, des espaces de travail magnifiquement conçus et des œuvres d'art dans toutes les salles de réunion. Après une journée productive, profitez des nombreux restaurants à proximité ou faites une promenade agréable jusqu'à Heritage Park en bord de mer pour vous détendre.
Toronto - Rue Toronto
36, rue Toronto, Toronto, Canada, M5C 2C5
À quelques pas du prestigieux centre financier de Toronto. Liaison rapide vers l'aéroport international Pearson - à moins de 30 minutes.
Ottawa - 343 Preston
343, rue Preston, Ottawa, Canada, K1S 1N4
Au dernier étage d'une tour de bureaux distinctive, bien visible depuis l'autoroute 417, vous trouverez le Regus 343 Preston Centre à Ottawa. À seulement 10 minutes en voiture du centre-ville d'Ottawa, à quelques pas du lac Downs et à proximité de l'intersection animée de Preston Gladstone dans la Petite Italie.
Mississauga - Airways
5925, chemin de l'Aéroport, Mississauga, Canada, L4V 1W1
Airways est un magnifique centre situé au 5925 Airport Road, juste en face de l'aéroport international Pearson de Toronto, qui propose des services de navette. Adjacent aux autoroutes 409 et 427, notre centre est facilement accessible.
Huawei Ascend est une famille de processeurs IA conçus pour l'inférence et l'entraînement haute performance.
Cette formation en présentiel ou à distance, animée par un formateur, s'adresse aux ingénieurs en IA et aux data scientists de niveau intermédiaire qui souhaitent développer et optimiser des modèles de réseaux neuronaux à l'aide de la plateforme Ascend de Huawei et de la boîte à outils CANN.
À l'issue de cette formation, les participants seront capables de :
Installer et configurer l'environnement de développement CANN.
Développer des applications IA à l'aide de MindSpore et des workflows CloudMatrix.
Optimiser les performances sur les NPU Ascend à l'aide d'opérateurs personnalisés et du tuilage.
Déployer des modèles dans des environnements edge ou cloud.
Format de la formation
Cours interactif et discussions.
Pratique avec la plateforme Huawei Ascend et la boîte à outils CANN dans des applications d'exemple.
Exercices guidés axés sur la création, l'entraînement et le déploiement de modèles.
Options de personnalisation de la formation
Pour demander une formation personnalisée pour ce cours en fonction de votre infrastructure ou de vos jeux de données, veuillez nous contacter pour en convenir.
La pile IA de Huawei, allant du SDK CANN de bas niveau au framework MindSpore de haut niveau, offre un environnement de développement et de déploiement IA étroitement intégré, optimisé pour le matériel Ascend.
Cette formation en présentiel (en ligne ou sur site) est destinée à des professionnels techniques de niveau débutant à intermédiaire souhaitant comprendre comment les composants CANN et MindSpore fonctionnent ensemble pour soutenir la gestion du cycle de vie de l'IA et les décisions d'infrastructure.
À l'issue de cette formation, les participants seront en mesure de :
Comprendre l'architecture en couches de la pile de calcul IA de Huawei.
Identifier comment CANN soutient l'optimisation des modèles et le déploiement au niveau du matériel.
Évaluer le framework MindSpore et sa chaîne d'outils par rapport aux alternatives de l'industrie.
Positionner la pile IA de Huawei dans des environnements d'entreprise, qu'ils soient dans le cloud ou sur site (on-prem).
Format de la formation
Conférence interactive et discussions.
Démonstrations système en direct et ateliers basés sur des cas pratiques.
Laboratoires guidés optionnels sur le flux de modèles, de MindSpore à CANN.
Options de personnalisation de la formation
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour en discuter.
Cette formation en direct animée par un instructeur en <lieu> (en ligne ou en présentiel) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenACC pour programmer des appareils hétérogènes et exploiter leur parallélisme.
À la fin de cette formation, les participants seront capables de :
Configurer un environnement de développement OpenACC.
Écrire et exécuter un programme OpenACC de base.
Annoter le code avec des directives et des clauses OpenACC.
Utiliser l'API et les bibliothèques OpenACC.
Profiling, déboguer et optimiser les programmes OpenACC.
Le SDK CANN (Compute Architecture for Neural Networks) fournit des outils puissants de déploiement et d'optimisation pour les applications d'IA en temps réel dans les domaines de la vision par ordinateur et du TAL, en particulier sur le matériel Huawei Ascend.
Cette formation pratique dirigée par un instructeur (en ligne ou en présentiel) s'adresse aux praticiens de l'IA de niveau intermédiaire qui souhaitent construire, déployer et optimiser des modèles de vision et de langage en utilisant le SDK CANN pour des cas d'utilisation en production.
À l'issue de cette formation, les participants seront en mesure de :
Déployer et optimiser des modèles de vision par ordinateur et de TAL à l'aide de CANN et d'AscendCL.
Utiliser les outils CANN pour convertir des modèles et les intégrer dans des pipelines en temps réel.
Optimiser les performances d'inférence pour des tâches telles que la détection, la classification et l'analyse des sentiments.
Construire des pipelines de vision par ordinateur et de TAL en temps réel pour des scénarios de déploiement sur edge ou dans le cloud.
Format du cours
Conférence interactive et démonstration.
Atelier pratique avec déploiement de modèles et profilage des performances.
Conception de pipelines en direct en utilisant des cas d'utilisation réels de vision par ordinateur et de TAL.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Cette formation en direct, animée par un formateur, en <lieu> (en ligne ou en présentiel), s'adresse aux développeurs de niveau débutant à intermédiaire souhaitant apprendre les bases de la programmation GPU ainsi que les principaux frameworks et outils pour le développement d'applications GPU.
À l'issue de cette formation, les participants seront en mesure de : Comprendre la différence entre le calcul CPU et GPU, ainsi que les avantages et les défis de la programmation GPU.
Choisir le framework et l'outil adaptés à leur application GPU.
Créer un programme GPU de base effectuant une addition de vecteurs en utilisant un ou plusieurs des frameworks et outils.
Utiliser les API, langages et bibliothèques respectifs pour interroger les informations de l'appareil, allouer et libérer la mémoire de l'appareil, copier des données entre l'hôte et l'appareil, lancer des noyaux et synchroniser les threads.
Utiliser les espaces mémoire respectifs, tels que global, local, constant et privé, pour optimiser les transferts de données et les accès mémoire.
Utiliser les modèles d'exécution respectifs, tels que les work-items, les work-groups, les threads, les blocs et les grilles, pour contrôler le parallélisme.
Débugger et tester des programmes GPU à l'aide d'outils tels que CodeXL, CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes GPU à l'aide de techniques telles que le regroupement (coalescing), la mise en cache, la pré-extraction (prefetching) et le profilage.
CANN TIK (Tensor Instruction Kernel) et Apache TVM permettent l'optimisation avancée et la personnalisation des opérateurs de modèles d'IA pour le matériel Huawei Ascend.
Cette formation en direct animée par un formateur (en ligne ou sur site) s'adresse aux développeurs système de niveau avancé souhaitant créer, déployer et affiner des opérateurs personnalisés pour des modèles d'IA en utilisant le modèle de programmation TIK de CANN et l'intégration du compilateur TVM.
À l'issue de cette formation, les participants seront capables de :
Écrire et tester des opérateurs d'IA personnalisés à l'aide du DSL TIK pour les processeurs Ascend.
Intégrer des ops personnalisés dans le runtime CANN et le graphe d'exécution.
Utiliser TVM pour la planification des opérateurs, l'auto-tuning et le benchmarking.
Déboguer et optimiser les performances au niveau des instructions pour des motifs de calcul personnalisés.
Format du cours
Cours interactif et démonstrations.
Codage pratique d'opérateurs utilisant les pipelines TIK et TVM.
Tests et affinement sur du matériel Ascend ou des simulateurs.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Cette formation en direct, animée par un formateur à Ontario (en ligne ou sur site), s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser différents frameworks pour la programmation GPU et comparer leurs fonctionnalités, performances et compatibilité.
À l'issue de cette formation, les participants seront en mesure de :
Configurer un environnement de développement incluant le SDK OpenCL, le kit d'outils CUDA, la plateforme ROCm, un appareil prenant en charge OpenCL, CUDA ou ROCm, et Visual Studio Code.
Créer un programme GPU de base effectuant une addition de vecteurs à l'aide d'OpenCL, CUDA et ROCm, et comparer la syntaxe, la structure et l'exécution de chaque framework.
Utiliser les API respectives pour interroger les informations sur les appareils, allouer et libérer la mémoire de l'appareil, copier des données entre l'hôte et l'appareil, lancer des noyaux et synchroniser les threads.
Utiliser les langages respectifs pour écrire des noyaux qui s'exécutent sur l'appareil et manipulent des données.
Utiliser les fonctions intégrées, variables et bibliothèques respectives pour effectuer des tâches et opérations courantes.
Utiliser les espaces mémoire respectifs, tels que global, local, constant et privé, pour optimiser les transferts de données et les accès mémoire.
Utiliser les modèles d'exécution respectifs pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes GPU à l'aide d'outils tels que CodeXL, CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes GPU en utilisant des techniques telles que le regroupement (coalescing), la mise en cache, la pré-fetching et le profilage.
CloudMatrix est la plateforme unifiée de développement et de déploiement d'IA de Huawei, conçue pour soutenir des pipelines d'inférence évolutifs et de niveau production.
Cette formation en direct animée par un instructeur (en ligne ou sur site) s'adresse aux professionnels de l'IA de niveau débutant à intermédiaire qui souhaitent déployer et superviser des modèles d'IA à l'aide de la plateforme CloudMatrix, intégrée avec CANN et MindSpore.
À l'issue de cette formation, les participants seront capables de :
Utiliser CloudMatrix pour l'emballage, le déploiement et la mise à disposition des modèles.
Convertir et optimiser les modèles pour les chipsets Ascend.
Mettre en place des pipelines pour les tâches d'inférence en temps réel et par lots.
Superviser les déploiements et ajuster les performances dans des environnements de production.
Format du cours
Cours interactif et discussions.
Utilisation pratique de CloudMatrix avec des scénarios de déploiement réels.
Exercices guidés axés sur la conversion, l'optimisation et la mise à l'échelle.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, basée sur votre infrastructure d'IA ou votre environnement cloud, veuillez nous contacter pour en convenir.
La boîte à outils Ascend CANN de Huawei permet une inférence IA puissante sur des appareils en périphérie tels que l'Ascend 310. CANN fournit des outils essentiels pour compiler, optimiser et déployer des modèles dans des environnements à la puissance de calcul et à la mémoire limitées.
Cette formation en présentiel (en ligne ou sur site) est destinée aux développeurs et intégrateurs IA de niveau intermédiaire souhaitant déployer et optimiser des modèles sur des appareils en périphérie Ascend à l'aide de la chaîne d'outils CANN.
À l'issue de cette formation, les participants seront en mesure de :
Préparer et convertir des modèles IA pour l'Ascend 310 en utilisant les outils CANN.
Concevoir des pipelines d'inférence légers avec MindSpore Lite et AscendCL.
Optimiser les performances des modèles pour des environnements à ressources limitées (calcul et mémoire).
Déployer et surveiller des applications IA dans des cas d'utilisation réels en périphérie.
Format de la formation
Cours interactif et démonstrations.
Ateliers pratiques sur des modèles et scénarios spécifiques à la périphérie.
Exemples de déploiement en direct sur du matériel virtuel ou physique en périphérie.
Options de personnalisation de la formation
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour en discuter.
Cette formation en direct animée par un instructeur en Ontario (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent installer et utiliser ROCm sur Windows pour programmer des GPU AMD et exploiter leur parallélisme.
À la fin de cette formation, les participants seront capables de :
Mettre en place un environnement de développement incluant la plate-forme ROCm, un GPU AMD et Visual Studio Code sous Windows.
Créer un programme ROCm de base effectuant une addition de vecteurs sur le GPU et récupérant les résultats de la mémoire du GPU.
Utiliser l'API ROCm pour interroger les informations du dispositif, allouer et libérer de la mémoire de dispositif, copier des données entre l'hôte et le dispositif, lancer des noyaux (kernels) et synchroniser les threads.
Utiliser le langage HIP pour écrire des noyaux qui s'exécutent sur le GPU et manipulent les données.
Utiliser les fonctions intégrées, les variables et les bibliothèques HIP pour effectuer des tâches et opérations courantes.
Utiliser les espaces mémoire ROCm et HIP, tels que global, partagé, constant et local, pour optimiser les transferts de données et les accès mémoire.
Utiliser les modèles d'exécution ROCm et HIP pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes ROCm et HIP à l'aide d'outils tels que ROCm Debugger et ROCm Profiler.
Optimiser les programmes ROCm et HIP en utilisant des techniques telles que la concaténation (coalescing), la mise en cache, la prérecherche (prefetching) et le profilage.
Cette formation en direct, encadrée par un instructeur, en <lieu> (en ligne ou sur site), s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser ROCm et HIP pour programmer les GPU AMD et exploiter leur parallélisme.
À la fin de cette formation, les participants seront capables de :
Mettre en place un environnement de développement comprenant la plateforme ROCm, un GPU AMD et Visual Studio Code.
Créer un programme ROCm basique effectuant une addition vectorielle sur le GPU et récupérant les résultats depuis la mémoire du GPU.
Utiliser l'API ROCm pour interroger les informations du périphérique, allouer et libérer de la mémoire sur le périphérique, copier des données entre l'hôte et le périphérique, lancer des kernels et synchroniser les threads.
Utiliser le langage HIP pour écrire des kernels qui s'exécutent sur le GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques de HIP pour effectuer des tâches et opérations courantes.
Utiliser les espaces mémoire de ROCm et HIP, tels que global, partagé, constant et local, pour optimiser les transferts de données et les accès mémoire.
Utiliser les modèles d'exécution de ROCm et HIP pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes ROCm et HIP à l'aide d'outils tels que ROCm Debugger et ROCm Profiler.
Optimiser les programmes ROCm et HIP en utilisant des techniques telles que la fusion des accès, la mise en cache, le préchargement et le profilage.
Le CANN (Compute Architecture for Neural Networks) est la boîte à outils de calcul IA de Huawei, utilisée pour compiler, optimiser et déployer des modèles IA sur des processeurs IA Ascend.
Cette formation animée par un instructeur (en ligne ou sur site) s'adresse aux développeurs IA débutants qui souhaitent comprendre comment le CANN s'intègre dans le cycle de vie du modèle, de l'entraînement au déploiement, et comment il fonctionne avec des frameworks tels que MindSpore, TensorFlow et PyTorch.
À l'issue de cette formation, les participants seront capables de :
Comprendre l'objectif et l'architecture de la boîte à outils CANN.
Configurer un environnement de développement avec CANN et MindSpore.
Convertir et déployer un modèle IA simple sur du matériel Ascend.
Acquérir des connaissances fondamentales pour de futurs projets d'optimisation ou d'intégration avec CANN.
Format du cours
Cours interactif et débats.
Travaux pratiques avec déploiement de modèles simples.
Guide étape par étape de la chaîne d'outils CANN et des points d'intégration.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Ascend, Biren et Cambricon sont des plateformes matérielles d'IA de premier plan en Chine, offrant chacune des outils d'accélération et de profilage uniques pour des charges de travail d'IA à grande échelle en production.
Cette formation en présentiel ou à distance, animée par un instructeur, s'adresse aux ingénieurs avancés en infrastructure et performance d'IA souhaitant optimiser les flux de travail d'inférence et d'entraînement sur plusieurs plateformes de puces d'IA chinoises.
À l'issue de cette formation, les participants seront capables de :
Réaliser des benchmarks de modèles sur les plateformes Ascend, Biren et Cambricon.
Identifier les goulots d'étranglement système et les inefficacités mémoire/calcul.
Appliquer des optimisations aux niveaux du graphique, des noyaux et des opérateurs.
Ajuster les pipelines de déploiement pour améliorer le débit et la latence.
Format du cours
Cours interactif et discussions.
Prise en main des outils de profilage et d'optimisation sur chaque plateforme.
Exercices guidés axés sur des scénarios pratiques de réglage.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, adaptée à votre environnement de performance ou à votre type de modèle, veuillez nous contacter afin d'organiser cela.
Le kit de développement CANN (Compute Architecture for Neural Networks) est la base informatique d'intelligence artificielle de Huawei, permettant aux développeurs d'ajuster et d'optimiser les performances des réseaux de neurones déployés sur les processeurs IA Ascend.
Ce cours en présentiel (en ligne ou sur site) est destiné aux développeurs IA de niveau avancé et aux ingénieurs systèmes souhaitant optimiser les performances d'inférence à l'aide de la suite d'outils avancés de CANN, y compris le moteur de graphes (Graph Engine), TIK et le développement d'opérateurs personnalisés.
À l'issue de cette formation, les participants seront capables de :
Comprendre l'architecture d'exécution et le cycle de vie des performances de CANN.
Utiliser les outils de profilage et le moteur de graphes pour l'analyse et l'optimisation des performances.
Créer et optimiser des opérateurs personnalisés à l'aide de TIK et de TVM.
Résoudre les goulets d'étranglement mémoire et améliorer le débit des modèles.
Format du cours
Cours interactif et discussions.
Pratiques avec des profils en temps réel et réglage des opérateurs.
Exercices d'optimisation à l'aide d'exemples de déploiement de cas limites.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin d'en convenir.
Les architectures GPU chinoises, telles que Huawei Ascend, Biren et les MLU de Cambricon, offrent des alternatives à CUDA adaptées aux marchés locaux de l'IA et du calcul haute performance (HPC).
Cette formation en présentiel ou en ligne, animée par un expert, s'adresse aux programmeurs GPU avancés et aux spécialistes de l'infrastructure souhaitant migrer et optimiser leurs applications CUDA existantes afin de les déployer sur des plateformes matérielles chinoises.
À l'issue de cette formation, les participants seront capables de :
Évaluer la compatibilité des charges de travail CUDA existantes avec les puces chinoises alternatives.
Porter les bases de code CUDA vers les environnements Huawei CANN, Biren SDK et Cambricon BANGPy.
Comparer les performances et identifier les points d'optimisation entre les différentes plateformes.
Aborder les défis pratiques liés au support et au déploiement entre architectures.
Format du cours
Conférence interactive et discussion.
Pratiques guidées de traduction de code et de comparaison des performances.
Exercices ciblés sur les stratégies d'adaptation multi-GPU.
Options de personnalisation du cours
Pour demander une formation personnalisée basée sur votre plateforme ou votre projet CUDA, veuillez nous contacter pour convenir des modalités.
Cette formation en présentiel (en ligne ou sur site) encadrée par un instructeur s'adresse aux développeurs de niveau débutant à intermédiaire souhaitant utiliser CUDA pour programmer les GPU NVIDIA et exploiter leur parallélisme.
À l'issue de cette formation, les participants seront en mesure de :
Configurer un environnement de développement incluant le CUDA Toolkit, un GPU NVIDIA et Visual Studio Code.
Créer un programme CUDA de base effectuant une addition de vecteurs sur le GPU et récupérant les résultats depuis la mémoire du GPU.
Utiliser l'API CUDA pour interroger les informations du dispositif, allouer et libérer de la mémoire de dispositif, copier des données entre l'hôte et le dispositif, lancer des noyaux (kernels) et synchroniser les threads.
Utiliser le langage CUDA C/C++ pour écrire des noyaux qui s'exécutent sur le GPU et manipulent les données.
Utiliser les fonctions intégrées, variables et bibliothèques de CUDA pour effectuer des tâches et opérations courantes.
Utiliser les espaces mémoire de CUDA, tels que global, partagé, constant et local, pour optimiser les transferts de données et les accès mémoire.
Utiliser le modèle d'exécution de CUDA pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester des programmes CUDA à l'aide d'outils tels que CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes CUDA en utilisant des techniques telles que le regroupement (coalescing), la mise en cache, la prérecherche et le profilage.
CANN (Compute Architecture for Neural Networks) est la pile de calcul IA de Huawei, conçue pour déployer et optimiser des modèles d'IA sur les processeurs AI Ascend.
Cette formation en présentiel ou en ligne, animée par un formateur, s'adresse aux développeurs et ingénieurs en IA de niveau intermédiaire souhaitant déployer efficacement des modèles d'IA entraînés sur du matériel Huawei Ascend à l'aide de la boîte à outils CANN et d'outils tels que MindSpore, TensorFlow ou PyTorch.
À l'issue de cette formation, les participants seront capables de :
Comprendre l'architecture de CANN et son rôle dans le pipeline de déploiement de l'IA.
Convertir et adapter des modèles provenant de frameworks populaires vers des formats compatibles avec Ascend.
Utiliser des outils tels que ATC, la conversion de modèles OM et MindSpore pour l'inférence en edge et dans le cloud.
Diagnostiquer les problèmes de déploiement et optimiser les performances sur le matériel Ascend.
Format du cours
Cours interactif et démonstrations.
Travaux pratiques en laboratoire utilisant les outils CANN et des simulateurs ou appareils Ascend.
Scénarios de déploiement concrets basés sur des modèles d'IA du monde réel.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Les accélérateurs IA Biren sont des GPU haute performance conçus pour les charges de travail d'IA et de calcul haute performance (HPC), avec prise en charge de l'entraînement et de l'inférence à grande échelle.
Cette formation en direct animée par un instructeur (en ligne ou sur site) s'adresse aux développeurs de niveau intermédiaire à avancé souhaitant programmer et optimiser des applications à l'aide de la pile GPU propriétaire de Biren, avec des comparaisons pratiques par rapport aux environnements basés sur CUDA.
À l'issue de cette formation, les participants seront en mesure de :
Comprendre l'architecture GPU Biren et sa hiérarchie mémoire.
Configurer l'environnement de développement et utiliser le modèle de programmation de Biren.
Traduire et optimiser du code de style CUDA pour les plateformes Biren.
Appliquer des techniques de réglage des performances et de débogage.
Format de la formation
Conférence interactive et discussions.
Utilisation pratique du SDK Biren sur des charges de travail GPU d'exemple.
Exercices guidés axés sur la migration et le réglage des performances.
Options de personnalisation de la formation
Pour demander une formation personnalisée pour ce cours, basée sur votre pile d'applications ou vos besoins d'intégration, veuillez nous contacter pour organiser cela.
Les MLU (Unités de calcul pour l'intelligence artificielle) de Cambricon sont des puces AI spécialisées, optimisées pour l'inférence et l'entraînement dans des environnements de pointe et de data centers.
Cette formation en direct, animée par un formateur (en ligne ou sur site), s'adresse aux développeurs de niveau intermédiaire souhaitant concevoir et déployer des modèles d'IA à l'aide du framework BANGPy et du SDK Neuware sur du matériel Cambricon MLU.
À l'issue de cette formation, les participants seront capables de :
Configurer et mettre en place les environnements de développement BANGPy et Neuware.
Développer et optimiser des modèles basés sur Python et C++ pour les MLU Cambricon.
Déployer des modèles sur des appareils edge et des data centers exécutant le runtime Neuware.
Intégrer des workflows ML avec les fonctionnalités d'accélération spécifiques aux MLU.
Format de la formation
Cours interactifs et discussions.
Mise en pratique de BANGPy et Neuware pour le développement et le déploiement.
Exercices guidés axés sur l'optimisation, l'intégration et les tests.
Options de personnalisation de la formation
Pour demander une formation personnalisée adaptée à votre modèle d'appareil Cambricon ou à votre cas d'utilisation, veuillez nous contacter afin d'en convenir.
Cette formation en direct, animée par un formateur à Ontario (en ligne ou sur site), s'adresse aux administrateurs système et professionnels de l'informatique de niveau débutant qui souhaitent installer, configurer, gérer et dépanner des environnements CUDA.
À la fin de cette formation, les participants seront en mesure de :
Comprendre l'architecture, les composants et les capacités de CUDA.
Installer et configurer des environnements CUDA.
Gérer et optimiser les ressources CUDA.
Débugger et dépanner les problèmes courants de CUDA.
Cette formation en direct dirigée par un instructeur dans Ontario (en ligne ou sur place) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenCL pour programmer des appareils hétérogènes et exploiter leur parallélisme.
À la fin de cette formation, les participants seront en mesure de :
Configurer un environnement de développement incluant le SDK OpenCL, un appareil compatible avec OpenCL et Visual Studio Code.
Créer un programme OpenCL de base effectuant une addition de vecteurs sur l'appareil et récupérant les résultats de la mémoire de l'appareil.
Utiliser l'API OpenCL pour interroger les informations de l'appareil, créer des contextes, des files d'attente de commandes, des tampons, des kernels et des événements.
Utiliser le langage C OpenCL pour écrire des kernels qui s'exécutent sur l'appareil et manipulent les données.
Utiliser les fonctions intégrées, les extensions et les bibliothèques OpenCL pour effectuer des tâches et opérations courantes.
Utiliser les modèles de mémoire hôte et appareil OpenCL pour optimiser les transferts de données et les accès mémoire.
Utiliser le modèle d'exécution OpenCL pour contrôler les éléments de travail, les groupes de travail et les plages ND.
Déboguer et tester les programmes OpenCL à l'aide d'outils tels que CodeXL, Intel VTune et NVIDIA Nsight.
Optimiser les programmes OpenCL à l'aide de techniques telles que la vectorisation, le déroulage de boucles, la mémoire locale et le profilage.
Ce cours de formation en présentiel dirigé par un instructeur en <lieu> couvre la programmation des GPU pour le calcul parallèle, l'utilisation de diverses plateformes, le travail avec la plateforme CUDA et ses fonctionnalités, ainsi que la réalisation de diverses techniques d'optimisation à l'aide de CUDA. Parmi les applications figurent l'apprentissage profond, l'analyse de données, le traitement d'image et les applications d'ingénierie.
En savoir plus...
Dernière Mise À Jour:
Nos clients témoignent (1)
L'énergie et l'humour des formateurs.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
GPU formation à Ontario, Weekend Graphics Processing Unit cours à Ontario, Soir Graphics Processing Unit (GPU) formation à Ontario, Graphics Processing Unit formateur en ligne à Ontario, Graphics Processing Unit formation à Ontario, GPU cours du soir à Ontario, GPU formation Intra à Ontario, GPU (Graphics Processing Unit) formation Intra Entreprise à Ontario, Graphics Processing Unit formation Inter à Ontario, Graphics Processing Unit (GPU) formation Inter Entreprise à Ontario, GPU (Graphics Processing Unit) instructeur à Ontario, GPU coaching à Ontario, Weekend GPU formation à Ontario, GPU (Graphics Processing Unit) stage de préparation à Ontario, Graphics Processing Unit préparation à Ontario, Soir GPU cours à Ontario, Graphics Processing Unit entraînement à Ontario, GPU cours privé à Ontario, GPU formateur à Ontario, Graphics Processing Unit professeur à Ontario,Graphics Processing Unit (GPU) cours à Ontario, Graphics Processing Unit (GPU) cours particuliers à Ontario, GPU (Graphics Processing Unit) préparation aux examens à Ontario, GPU sur place à Ontario, Graphics Processing Unit (GPU) coach à Ontario