Prenez contact avec nous

Plan du cours

Introduction à Apache Spark

  • Le rôle de Spark dans le traitement du Big Data.
  • Architecture de Spark et ses composants.

Installation d'Apache Spark

  • Exigences matérielles et logicielles.
  • Procédures d'installation en mode autonome et en mode cluster.
  • Meilleures pratiques de configuration pour les administrateurs système.

Administration des clusters Spark

  • Outils et techniques de gestion des clusters.
  • Surveillance des applications Spark et des ressources du cluster.
  • Configurations de sécurité et gestion des utilisateurs.

Ajustement et optimisation des performances

  • Allocation des ressources et planification.
  • Ajustement de Spark pour des performances optimales.
  • Identification et résolution des goulots d'étranglement courants.

Dépannage et résolution de problèmes

  • Challenges courants de l'administration de Spark.
  • Outils et techniques de diagnostic pour le dépannage.
  • Approche étape par étape pour résoudre les problèmes courants.
  • Meilleures pratiques pour maintenir un environnement Spark sain.

Sujets avancés d'administration

  • Intégration avec d'autres outils du Big Data.
  • Assurer la haute disponibilité et la reprise après sinistre.
  • Mise à niveau et mise à l'échelle des clusters Spark.

Résumé et prochaines étapes

Pré requis

  • Connaissances de base en configuration et gestion de réseaux.
  • Familiarité avec le système d'exploitation Linux et l'interface en ligne de commande.
  • Intérêt pour l'apprentissage des systèmes de calcul distribué et la gestion du Big Data.

Audience cible

  • Administrateurs système.
 35 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires