Accueil
Formation Big Data
Formation Hadoop
Formation Administrator Training for Apache Hadoop

Formation Administrator Training for Apache Hadoop

Le cours s'adresse aux spécialistes de l'informatique :

Ce cours s'adresse aux spécialistes de l'informatique qui recherchent une solution pour stocker et traiter de grands ensembles de données dans un environnement de système distribué.

Goal :

Connaissance approfondie de l'administration des clusters Hadoop.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Plan du cours

1 : HDFS (17%)

Décrire la fonction des démons HDFS
Décrire le fonctionnement normal d'un cluster Apache Hadoop, tant au niveau du stockage que du traitement des données.
Identifier les caractéristiques actuelles des systèmes informatiques qui motivent un système comme Apache Hadoop.
Classer les principaux objectifs de la conception de HDFS
Compte tenu d'un scénario, identifier le cas d'utilisation approprié pour la fédération HDFS
Identifier les composants et les démons d'un cluster HDFS HA-Quorum
Analyser le rôle de la sécurité HDFS (Kerberos)
Déterminer le meilleur choix de sérialisation des données pour un scénario donné
Décrire les chemins de lecture et d'écriture des fichiers
Identifier les commandes pour manipuler les fichiers dans le Hadoop File System Shell

2 : YARN et MapReduce version 2 (MRv2) (17%)

Comprendre comment la mise à jour d'un cluster de Hadoop 1 à Hadoop 2 affecte les paramètres du cluster
Comprendre comment déployer MapReduce v2 (MRv2 / YARN), y compris tous les démons YARN
Comprendre la stratégie de conception de base pour MapReduce v2 (MRv2)
Déterminer comment YARN gère les allocations de ressources
Identifier le flux de travail d'une tâche MapReduce exécutée sur YARN
Déterminer quels fichiers vous devez modifier et comment afin de migrer un cluster de MapReduce version 1 (MRv1) à MapReduce version 2 (MRv2) fonctionnant sur YARN.

3 : Hadoop Planification du cluster (16%)

Principaux points à prendre en compte dans le choix du matériel et des systèmes d'exploitation pour héberger un cluster Apache Hadoop.
Analyser les choix dans la sélection d'un système d'exploitation
Comprendre le réglage du noyau et l'échange de disques.
Compte tenu d'un scénario et d'une charge de travail, identifier une configuration matérielle adaptée au scénario.
Compte tenu d'un scénario, déterminer les composants de l'écosystème que votre grappe doit exécuter pour respecter l'accord de niveau de service (SLA).
Dimensionnement de la grappe : compte tenu d'un scénario et de la fréquence d'exécution, identifier les spécificités de la charge de travail, y compris l'unité centrale, la mémoire, le stockage, les entrées/sorties de disque.
Dimensionnement et configuration des disques : JBOD ou RAID, SAN, virtualisation et exigences en matière de dimensionnement des disques dans un cluster.
Topologies de réseau : comprendre l'utilisation du réseau dans Hadoop (pour HDFS et MapReduce) et proposer ou identifier les composants clés de la conception du réseau pour un scénario donné.

4 : Hadoop Installation et administration d'un cluster (25%)

A partir d'un scénario, identifier comment le cluster va gérer les pannes de disques et de machines.
Analyser une configuration de journalisation et le format d'un fichier de configuration de journalisation
Comprendre les bases des métriques Hadoop et de la surveillance de l'état des clusters
Identifier la fonction et l'objectif des outils disponibles pour la surveillance des clusters
Être capable d'installer tous les composants de l'écosystème dans CDH 5, y compris (mais sans s'y limiter) : Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive et Pig
Identifier la fonction et l'objectif des outils disponibles pour gérer le système de fichiers Apache Hadoop.

5 : Ressources Management (10%)

Comprendre les objectifs généraux de conception de chacun des ordonnanceurs Hadoop.
A partir d'un scénario, déterminer comment l'ordonnanceur FIFO alloue les ressources d'un cluster
Dans le cadre d'un scénario, déterminer comment l'ordonnanceur Fair Scheduler alloue les ressources des clusters sous YARN
Compte tenu d'un scénario, déterminer comment l'ordonnanceur Capacity Scheduler alloue les ressources du cluster.

6 : Surveillance et journalisation (15%)

Comprendre les fonctions et les caractéristiques des capacités de collecte de métriques de Hadoop.
Analyser les interfaces Web NameNode et JobTracker
Comprendre comment surveiller les Daemons du cluster
Identifier et surveiller l'utilisation du CPU sur les noeuds maîtres
Décrire comment surveiller l'allocation de swap et de mémoire sur tous les nœuds
Identifier comment visualiser et gérer les fichiers journaux de Hadoop.
Interpréter un fichier journal

Pré requis

Compétences de base en administration Linux.
Compétences de base en programmation

35 Heures

Nombre de participants

En ligne

Salle de Classe

Choisir le lieu

Veuillez choisir le lieu souhaité

Prix par Participant

Les formations ouvertes requièrent plus de 3 participants.

Formation Administrator Training for Apache Hadoop - Booking

Nom Complet *

Email *

Téléphone *

Poste

Nom de l'entreprise

Adresse 1 *

Ville *

État / Province

Pays *

Code postal *

Date de début

Numéro d'identification fiscale

Les dates sont soumises à disponibilité et se déroulent entre 09:30 et 16:30.

Paiement *

Virement bancaire (facture, commande)

Carte de débit / Carte de crédit

Commentaires

Autoriser la publication du certificat

Si vous cochez cette case, les participants auront la possibilité de publier leur certificat de réalisation dans le catalogue des professionnels certifiés de NobleProg.

Termes et Conditions *

Je suis un représentant autorisé du client et je souhaite réserver la formation / services conformément aux conditions générales et à la politique de confidentialité de NobleProg.

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Formation Administrator Training for Apache Hadoop - Enquiry

Nom Complet *

Email *

Téléphone *

Nombre de participants

Nom de l'entreprise

Adresse de l'entreprise

Comment souhaitez-vous suivre le cours ?

Locaux Clients

En ligne

Salle de Classe

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Administrator Training for Apache Hadoop - Demande d'informations consulting

Demande d'informations consulting

Nom Complet *

Téléphone *

Email *

Nom de l'entreprise

Sujet du Conseil *

But du Consulting

Durée de la mission de conseil

Nombre de Consultants

Date souhaitée

Avec qui le consultant travaillera?

Agence de Conseil *

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Nos clients témoignent (3)

CA$ 8,784 (En ligne)

CA$ 10,234 (Salle de Classe)

Cours Similaires

Programming with Big Data in R

21 Heures

Big Data désigne des solutions destinées au stockage et au traitement de grands ensembles de données. Développé par Go Ogle au départ, ces Big Data volumes de Big Data des solutions ont évolué et inspiré d' autres projets similaires, dont beaucoup sont disponibles en open source. R est un langage de programmation populaire dans le secteur financier.

Data Mining with R

14 Heures

Econometrics: Eviews and Risk Simulator

21 Heures

Cette formation en direct avec formateur dans Canada (en ligne ou sur site) s'adresse à toute personne souhaitant apprendre et maîtriser les fondamentaux de l'analyse et du modélisation économétrique.

À la fin de cette formation, les participants seront capables de :

Apprendre et comprendre les fondamentaux de l'économétrie.
Utiliser Eviews et des simulateurs de risque.

Forecasting with R

14 Heures

Cette formation en direct avec instructeur à Canada (en ligne ou sur site) est destinée aux analystes de données de niveau intermédiaire et aux professionnels qui souhaitent effectuer des prévisions de séries temporelles et automatiser des flux de travail d'analyse de données à l'aide de R.

A l'issue de cette formation, les participants seront capables de :

Comprendre les principes fondamentaux des techniques de prévision en R.
Appliquer le lissage exponentiel et les modèles ARIMA pour l'analyse des séries temporelles.
Utiliser le package 'forecast' pour générer des modèles de prévision précis.
Automatiser les flux de travail de prévision pour les applications commerciales et de recherche.

HR Analytics for Public Organisations

14 Heures

Cette formation en direct (en ligne ou sur site), dirigée par un instructeur, s'adresse aux professionnels des ressources humaines qui souhaitent utiliser des méthodes analytiques pour améliorer les performances de l'organisation. Ce cours couvre les approches qualitatives et quantitatives, empiriques et statistiques.

Format du cours

Exposé et discussion interactifs.
Beaucoup d'exercices et de pratique.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.

Marketing Analytics using R

21 Heures

Public

Business (responsables marketing, chefs de produit, responsables de clientèle) et leurs équipes; professionnels de la connaissance client.

Vue d'ensemble

Le cours suit le cycle de vie du client: acquisition de nouveaux clients, gestion de la rentabilité des clients existants, fidélisation des clients et enfin compréhension des clients qui nous laissent et pourquoi. Nous travaillerons avec des données réelles (si anonymes) de divers secteurs, notamment les télécommunications, les assurances, les médias et la haute technologie.

Format

Formation dirigée par un instructeur au cours de cinq séances d'une demi-journée comprenant des exercices en classe et des devoirs. Il peut être dispensé en classe ou à distance (en ligne).

R for Data Analysis and Research

7 Heures

Public

les gestionnaires
développeurs
scientifiques
étudiants

Format du cours

instructions et discussion en ligne OU ateliers en face-à-face

Introduction to R

21 Heures

R est un langage de programmation open-source gratuit pour la comptabilité statistique, l'analyse des données et les graphiques. La recherche est utilisée par un nombre croissant de gestionnaires et d'analystes de données à l'intérieur des sociétés et de l'académie. R a également trouvé des followers parmi des statistiques, des ingénieurs et des scientifiques sans compétences de programmation informatique qui le trouvent facile à utiliser. Sa popularité est due à l'utilisation croissante de l'exploitation de données pour divers objectifs tels que la fixation des prix publicitaires, la recherche de nouveaux médicaments plus rapidement ou des modèles financiers fine-tune. R a une grande variété de paquets pour l'exploitation de données.

Ce cours couvre la manipulation des objets dans R y compris les données de lecture, l'accès aux paquets R, l'écriture des fonctions R, et la création de graphiques informatifs. Il comprend l'analyse des données en utilisant des modèles statistiques communs. Le cours enseigne comment utiliser le logiciel R (https://www.r-project.org) à la fois sur une ligne de commande et dans une interface utilisateur graphique (GUI).

R

21 Heures

R est un langage de programmation gratuit à source ouverte pour l'informatique statistique, l'analyse de données et les graphiques. R est utilisé par un nombre croissant de gestionnaires et d'analystes de données au sein de sociétés et d'universités. R a également trouvé des adeptes parmi les statisticiens, ingénieurs et scientifiques sans compétences en programmation informatique et qui le trouvent facile à utiliser. Sa popularité est due à l'utilisation croissante de l'extraction de données pour divers objectifs, tels que fixer les prix des annonces, trouver plus rapidement de nouveaux médicaments ou affiner les modèles financiers. R propose une grande variété de packages pour l'exploration de données.

Neural Network avec R

14 Heures

Ce cours est une introduction à l'application de réseaux de neurones à des problèmes du monde réel à l'aide du logiciel R-project.

Advanced R Programming

7 Heures

Ce cours est destiné aux scientifiques et aux statisticiens qui possèdent déjà des compétences de base en codage R & C++ et un code R et qui ont besoin de compétences avancées en codage R.

Le but est de donner un cours de programmation R avancé et pratique aux participants intéressés par l’application des méthodes au travail.

Des exemples spécifiques à un secteur sont utilisés pour adapter la formation au public cible

Statistical Analysis using SPSS

21 Heures

Cette formation en direct avec instructeur à Canada (en ligne ou sur site) s'adresse aux professionnels de niveau débutant à intermédiaire qui souhaitent effectuer des analyses statistiques à l'aide de SPSS pour interpréter les données avec précision, exécuter des tests statistiques complexes et générer des informations significatives.

A l'issue de cette formation, les participants seront capables de :

Naviguer dans l'interface de SPSS et gérer efficacement les ensembles de données.
Effectuer des analyses statistiques descriptives et inférentielles.
Effectuer des tests t, ANOVA, MANOVA, des analyses de régression et de corrélation.
Appliquer des tests non paramétriques, l'analyse des composantes principales et l'analyse factorielle pour une interprétation avancée des données.

Talent Acquisition Analytics

14 Heures

Cette formation en direct (en ligne ou sur site) est destinée aux professionnels des ressources humaines et aux spécialistes du recrutement qui souhaitent utiliser des méthodes analytiques pour améliorer les performances de l'organisation. Ce cours couvre les approches qualitatives et quantitatives, empiriques et statistiques.

Format du cours

Exposé et discussion interactifs.
Beaucoup d'exercices et de pratique.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.

Introduction to Data Visualization with Tidyverse and R

7 Heures

Public

Format du cours

À la fin de cette formation, les participants seront en mesure de :

Dans ce cours dispensé par un formateur, les participants apprendront à manipuler et visualiser des données en utilisant les outils inclus dans le Tidyverse.

Le Tidyverse est une collection de packages R polyvalents pour nettoyer, traiter, modéliser et visualiser des données. Parmi les packages inclus figurent : ggplot2, dplyr, tidyr, readr, purrr et tibble.

Débutants en langage R
Débutants en analyse de données et visualisation de données

Partie cours, partie discussion, exercices et pratique intensive

Effectuer une analyse de données et créer des visualisations attrayantes
Tirer des conclusions utiles à partir de divers jeux de données d'exemples
Filtrer, trier et résumer les données pour répondre aux questions exploratoires
Transformer des données traitées en graphiques de ligne informatifs, diagrammes à barres et histogrammes
Importer et filtrer les données provenant de diverses sources de données, y compris Excel, CSV et fichiers SPSS

Building Web Applications in R with Shiny

7 Heures

La description:

Ce cours est conçu pour apprendre aux utilisateurs R à créer des applications Web sans avoir à apprendre le Java HTML , le script Java et les CSS inter-navigateurs.

Objectif:

Couvre les bases du fonctionnement des applications Shiny.

Couvre toutes les fonctions d’entrée / sortie / rendu / lissage couramment utilisées de la bibliothèque Shiny.

Formation Administrator Training for Apache Hadoop

Le cours s'adresse aux spécialistes de l'informatique :

Goal :

Plan du cours

1 : HDFS (17%)

2 : YARN et MapReduce version 2 (MRv2) (17%)

3 : Hadoop Planification du cluster (16%)

4 : Hadoop Installation et administration d'un cluster (25%)

5 : Ressources Management (10%)

6 : Surveillance et journalisation (15%)

Pré requis

Nos clients témoignent (3)

Jacek Pieczatka

Formation - Administrator Training for Apache Hadoop

Grzegorz Gorski

Formation - Administrator Training for Apache Hadoop

Simon Hahn

Formation - Administrator Training for Apache Hadoop

Cours à venir

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation Administrator Training for Apache Hadoop

Le cours s'adresse aux spécialistes de l'informatique :

Goal :

Plan du cours

1 : HDFS (17%)

2 : YARN et MapReduce version 2 (MRv2) (17%)

3 : Hadoop Planification du cluster (16%)

4 : Hadoop Installation et administration d'un cluster (25%)

5 : Ressources Management (10%)

6 : Surveillance et journalisation (15%)

Pré requis

Nos clients témoignent (3)

Jacek Pieczatka

Formation - Administrator Training for Apache Hadoop

Grzegorz Gorski

Formation - Administrator Training for Apache Hadoop

Simon Hahn

Formation - Administrator Training for Apache Hadoop

Cours à venir

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Cours Similaires

Programming with Big Data in R

Data Mining with R

Econometrics: Eviews and Risk Simulator

Forecasting with R

HR Analytics for Public Organisations

Marketing Analytics using R

Public

Vue d'ensemble

Format

R for Data Analysis and Research

Public

Format du cours

Introduction to R

R

Neural Network avec R

Advanced R Programming

Statistical Analysis using SPSS

Talent Acquisition Analytics

Introduction to Data Visualization with Tidyverse and R

Building Web Applications in R with Shiny

La description:

Objectif:

Catégories Similaires

Hadoop

Statistiques

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites