Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à Apache Spark
- Le rôle de Spark dans le traitement du Big Data.
- Architecture de Spark et ses composants.
Installation d'Apache Spark
- Exigences matérielles et logicielles.
- Procédures d'installation en mode autonome et en mode cluster.
- Meilleures pratiques de configuration pour les administrateurs système.
Administration des clusters Spark
- Outils et techniques de gestion des clusters.
- Surveillance des applications Spark et des ressources du cluster.
- Configurations de sécurité et gestion des utilisateurs.
Ajustement et optimisation des performances
- Allocation des ressources et planification.
- Ajustement de Spark pour des performances optimales.
- Identification et résolution des goulots d'étranglement courants.
Dépannage et résolution de problèmes
- Challenges courants de l'administration de Spark.
- Outils et techniques de diagnostic pour le dépannage.
- Approche étape par étape pour résoudre les problèmes courants.
- Meilleures pratiques pour maintenir un environnement Spark sain.
Sujets avancés d'administration
- Intégration avec d'autres outils du Big Data.
- Assurer la haute disponibilité et la reprise après sinistre.
- Mise à niveau et mise à l'échelle des clusters Spark.
Résumé et prochaines étapes
Pré requis
- Connaissances de base en configuration et gestion de réseaux.
- Familiarité avec le système d'exploitation Linux et l'interface en ligne de commande.
- Intérêt pour l'apprentissage des systèmes de calcul distribué et la gestion du Big Data.
Audience cible
- Administrateurs système.
35 Heures
Nos clients témoignent (2)
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique