Accueil
Formation Big Data
Formation Hadoop
Formation Hadoop pour Développeurs, niveau Acvancé

Formation Hadoop pour Développeurs, niveau Acvancé

Apache Hadoop est l'un des cadres les plus populaires pour traiter les Big Data sur des clusters de serveurs. Ce cours approfondit la gestion des données dans HDFS, Pig, Hive et HBase avancés. Ces techniques de programmation avancées seront bénéfiques aux développeurs expérimentés en Hadoop.

Public cible: développeurs

Durée : trois jours

Format : conférences (50 %) et laboratoires pratiques (50 %).

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Plan du cours

Section 1 : Gestion des données dans HDFS

Divers formats de données (JSON / Avro / Parquet)
Schémas de compression
Masquage des données
Laboratoires : Analyse de différents formats de données ; activation de la compression

Section 2 : Pig avancé

Fonctions définies par l'utilisateur
Introduction aux bibliothèques Pig (ElephantBird / Data-Fu)
Chargement de données structurées complexes avec Pig
Ajustement de Pig
Laboratoires : scriptage avancé en Pig, analyse de types de données complexes

Section 3 : Hive avancé

Fonctions définies par l'utilisateur
Tables compressées
Ajustement des performances de Hive
Laboratoires : création de tables compressées, évaluation des formats et configurations de table

Section 4 : HBase avancé

Modélisation de schémas avancés
Compression
Ingestion massive de données
Comparaison des tables larges et hautes
HBase et Pig
HBase et Hive
Ajustement des performances d'HBase
Laboratoires : ajustement d'HBase ; accès aux données HBase depuis Pig & Hive ; Utilisation de Phoenix pour la modélisation des données

Pré requis

être à l'aise avec le langage de programmation Java (la plupart des exercices de programmation sont en Java)
être à l'aise dans un environnement Linux (être capable de naviguer sur la ligne de commande Linux, d'éditer des fichiers avec vi / nano)
avoir une connaissance fonctionnelle de Hadoop.

Environnement de laboratoire

Installation zéro : Il n'est pas nécessaire d'installer le logiciel Hadoop sur les machines des étudiants ! Un cluster Hadoop fonctionnel sera fourni aux étudiants.

Les étudiants auront besoin de ce qui suit

21 Heures

Nombre de participants

En ligne

Salle de Classe

Choisir le lieu

Veuillez choisir le lieu souhaité

Prix par participant

Cours à partir de 4 + personnes. Pour un entraînement individuel ou en petit groupe, veuillez demander un devis.

Formation Hadoop pour Développeurs, niveau Acvancé - Réservation

Nom complet *

Email *

Téléphone *

Poste

Nom de l'entreprise

Adresse 1 *

Ville *

État / Province

Pays *

Code postal *

Date de début

Numéro d'identification fiscale

Les dates sont soumises à disponibilité et se déroulent entre 09:30 et 16:30.

Paiement *

Virement bancaire (facture, commande)

Carte de débit / Carte de crédit

Commentaires

Termes et Conditions *

Je suis un représentant autorisé du client et je souhaite réserver la formation / services conformément aux conditions générales et à la politique de confidentialité de NobleProg.

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Formation Hadoop pour Développeurs, niveau Acvancé - Demande de renseignements

Nom complet *

Email *

Téléphone *

Nombre de participants

Nom de l'entreprise

Adresse de l'entreprise

Comment souhaitez-vous suivre le cours ?

Locaux Clients

En ligne

Salle de Classe

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Hadoop pour Développeurs, niveau Acvancé - Demande d'informations consulting

Nom complet *

Téléphone *

Email *

Nom de l'entreprise

Sujet du Conseil *

But du Consulting

Avec qui le consultant travaillera?

Agence de Conseil *

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Nos clients témoignent (1)

Exercices pratiques. La formation aurait dû durer 5 jours, mais les 3 jours ont permis de clarifier beaucoup de questions que je me posais déjà en travaillant avec NiFi.

James - BHG Financial

Formation - Apache NiFi for Administrators

Traduction automatique

Cours à venir

Hadoop pour Développeurs, niveau Acvancé

2026-05-27 09:30

21 heures

201, avenue Portage

CA$ 9,390 (En ligne)

CA$ 12,390 (Salle de Classe)

Hadoop pour Développeurs, niveau Acvancé

2026-06-10 09:30

21 heures

Halifax-Place Métropolitaine

CA$ 9,390 (En ligne)

CA$ 12,390 (Salle de Classe)

Hadoop pour Développeurs, niveau Acvancé

2026-06-24 09:30

21 heures

Halifax - Purdy Wharf

CA$ 9,390 (En ligne)

CA$ 12,390 (Salle de Classe)

Hadoop pour Développeurs, niveau Acvancé

2026-07-08 09:30

21 heures

Dartmouth - Metropolitan Place

CA$ 9,390 (En ligne)

CA$ 12,390 (Salle de Classe)

Hadoop pour Développeurs, niveau Acvancé

2026-07-22 09:30

21 heures

Truro - Rue Commerciale

CA$ 9,390 (En ligne)

CA$ 12,390 (Salle de Classe)

Cours Similaires

Formation d'administrateur pour Apache Hadoop

35 Heures

Public cible :

Ce cours est destiné aux spécialistes des TIC à la recherche d'une solution pour stocker et traiter de grands ensembles de données dans un environnement de système distribué.

Goal :

Connaissance approfondie de l'administration des clusters Hadoop.

Analyse de données volumineuses dans la santé

21 Heures

L'analyse de données volumineuses implique le processus d'examen de grands ensembles de données variées afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles.

L'industrie de la santé dispose de masses de données médicales et cliniques complexes et hétérogènes. L'application de l'analyse de données volumineuses à des données de santé présente un énorme potentiel pour tirer des insights permettant d'améliorer la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis dans les analyses et les applications pratiques à un environnement clinique.

Dans cette formation dirigée par un formateur (à distance), les participants apprendront comment réaliser une analyse de données volumineuses dans la santé tout en effectuant une série d'exercices pratiques guidés.

À la fin de cette formation, les participants seront capables de :

Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
Comprendre les caractéristiques des données médicales
Appliquer des techniques de grandes données pour gérer les données médicales
Étudier les systèmes et algorithmes de grande donnée dans le contexte des applications de santé

Public visé

Développeurs
Data Scientists

Format du cours

Partie exposé, partie discussion, exercices et pratique intensive.

Note

Pour demander une formation sur mesure pour ce cours, veuillez nous contacter pour organiser.

Hadoop pour Administrateurs

21 Heures

Apache Hadoop est le cadre le plus populaire pour le traitement Big Data sur des clusters de serveurs. Au cours de ce stage de trois jours (quatre jours optionnellement), les participants apprendront les avantages commerciaux et les cas d'utilisation pour Hadoop et son écosystème, comment planifier la mise en place et l'expansion du cluster, comment installer, entretenir, surveiller, résoudre les problèmes et optimiser Hadoop. Ils pratiqueront également le chargement de données massives sur le cluster, se familiariseront avec diverses distributions Hadoop, et exerceront l'installation et la gestion des outils de l'écosystème Hadoop. Le cours se terminera par une discussion sur la sécurisation du cluster avec Kerberos.

“…Les matériaux étaient très bien préparés et couverts en profondeur. La salle d'exercices était très utile et bien organisée”
— Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising

Audience

Administrateurs Hadoop

Format

Conférences et ateliers pratiques, répartition approximative 60% conférences, 40% ateliers.

Hadoop pour les développeurs (4 jours)

28 Heures

Apache Hadoop est le framework le plus populaire pour traiter des données massives sur des clusters de serveurs. Ce cours introduira un développeur aux divers composants de l'écosystème Hadoop (HDFS, MapReduce, Pig, Hive et HBase).

Administration de Hadoop avec MapR

28 Heures

Public cible :

Ce cours vise à démystifier la technologie Big Data/Hadoop et à montrer qu'elle n'est pas difficile à comprendre.

Hadoop et Spark pour les administrateurs

35 Heures

Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux administrateurs système qui souhaitent apprendre à mettre en place, déployer et gérer des clusters Hadoop au sein de leur organisation.

A l'issue de cette formation, les participants seront capables de :

Installer et configurer Apache Hadoop.
Comprendre les quatre composants majeurs de l'écosystème Hadoop : HDFS, MapReduce, YARN et Hadoop Common.
Utiliser le système de fichiers distribués Hadoop (HDFS) pour faire évoluer un cluster vers des centaines ou des milliers de nœuds.
Configurer HDFS comme moteur de stockage pour les déploiements Spark sur site.
Configurer Spark pour accéder à des solutions de stockage alternatives telles qu'Amazon S3 et des systèmes de base de données NoSQL tels que Redis, Elasticsearch, Couchbase, Aerospike, etc.
Exécuter des tâches administratives telles que le provisionnement, la gestion, la surveillance et la sécurisation d'un cluster Apache Hadoop.

HBase pour les Développeurs

21 Heures

Ce cours introduit HBase – un stockage NoSQL basé sur Hadoop. Le cours est destiné aux développeurs qui utiliseront HBase pour développer des applications, ainsi qu'aux administrateurs qui géreront les clusters HBase.

Nous guiderons un développeur à travers l'architecture de HBase, la modélisation des données et le développement d'applications sur HBase. Il abordera également l'utilisation de MapReduce avec HBase, ainsi que certains sujets d'administration liés à l'optimisation des performances. Le cours est très pratique avec de nombreux exercices de laboratoire.

Durée : 3 jours

Public cible : Développeurs & Administrateurs

Apache NiFi pour les Administrateurs

21 Heures

Apache NiFi est une plateforme open-source, basée sur le flux de données, pour l'intégration et le traitement d'événements. Elle permet un routage, une transformation et une médiation en temps réel entre des systèmes disparates, avec une interface utilisateur web et un contrôle granulaire.

Cette formation dirigée par un instructeur (sur site ou à distance) est destinée aux administrateurs et ingénieurs de niveau intermédiaire qui souhaitent déployer, gérer, sécuriser et optimiser les flux de données NiFi dans des environnements de production.

À la fin de cette formation, les participants seront en mesure de :

Installer, configurer et maintenir des clusters Apache NiFi.
Concevoir et gérer des flux de données provenant de sources et de récepteurs variés.
Mettre en œuvre l'automatisation du flux, le routage et la logique de transformation.
Optimiser les performances, surveiller les opérations et dépanner les problèmes.

Format du cours

Cours interactif avec discussion sur l'architecture réelle.
Laboratoires pratiques : construction, déploiement et gestion des flux.
Exercices basés sur des scénarios dans un environnement de laboratoire en direct.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.

Apache NiFi pour les Développeurs

7 Heures

Au cours de cette formation en direct et dirigée par un instructeur dans Canada, les participants apprendront les principes fondamentaux de la programmation par flux en développant un certain nombre d'extensions, de composants et de processeurs de démonstration à l'aide de Apache NiFi.

A la fin de cette formation, les participants seront capables de :

Comprendre l'architecture de NiFi et les concepts de flux de données.
Développer des extensions en utilisant NiFi et des APIs tierces.
Développer leur propre processeur Apache Nifi.
Ingérer et traiter des données en temps réel à partir de formats de fichiers et de sources de données disparates et peu communs.

Python, Spark et Hadoop pour les grands volumes de données

21 Heures

Cette formation en Canada (en ligne ou sur site) est destinée aux développeurs qui souhaitent utiliser et intégrer Spark, Hadoop et Python pour traiter, analyser et transformer des ensembles de données complexes et volumineux.

A l'issue de cette formation, les participants seront capables de :

Mettre en place l'environnement nécessaire pour commencer à traiter les big data avec Spark, Hadoop et Python.
Comprendre les fonctionnalités, les composants de base et l'architecture de Spark et Hadoop.
Apprendre à intégrer Spark, Hadoop et Python pour le traitement des big data.
Explorer les outils de l'écosystème Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka et Flume).
Construire des systèmes de recommandation par filtrage collaboratif similaires à Netflix, YouTube, Amazon, Spotify et Google.
Utiliser Apache Mahout pour mettre à l'échelle des algorithmes d'apprentissage automatique.

Formation Hadoop pour Développeurs, niveau Acvancé

Plan du cours

Section 1 : Gestion des données dans HDFS

Section 2 : Pig avancé

Section 3 : Hive avancé

Section 4 : HBase avancé

Pré requis

Environnement de laboratoire

Nos clients témoignent (1)

James - BHG Financial

Formation - Apache NiFi for Administrators

Cours à venir

Hadoop pour Développeurs, niveau Acvancé

Hadoop pour Développeurs, niveau Acvancé

Hadoop pour Développeurs, niveau Acvancé

Hadoop pour Développeurs, niveau Acvancé

Hadoop pour Développeurs, niveau Acvancé

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites