Prenez contact avec nous

Plan du cours

Introduction

  • Comprendre l'importance de la préparation des données dans l'analyse et l'apprentissage automatique
  • La chaîne de traitement des données et son rôle dans le cycle de vie des données
  • Exploration des défis courants liés aux données brutes et de leur impact sur l'analyse

Collecte et acquisition des données

  • Sources de données : bases de données, API, feuilles de calcul, fichiers texte, et plus encore
  • Techniques de collecte des données et d'assurance de la qualité des données lors de la collecte
  • Collecte de données à partir de diverses sources

Techniques de nettoyage des données

  • Identification et traitement des valeurs manquantes, des valeurs aberrantes et des incohérences
  • Gestion des doublons et des erreurs dans l'ensemble de données
  • Nettoyage d'ensembles de données réels

Transformation et normalisation des données

  • Techniques de normalisation et de standardisation des données
  • Traitement des données catégorielles : encodage, discrétisation et ingénierie des caractéristiques
  • Transformation des données brutes en formats exploitables

Intégration et agrégation des données

  • Fusion et combinaison d'ensembles de données provenant de différentes sources
  • Résolution des conflits de données et alignement des types de données
  • Techniques d'agrégation et de consolidation des données

Assurance de la qualité des données

  • Méthodes pour assurer la qualité et l'intégrité des données tout au long du processus
  • Mise en œuvre de vérifications de qualité et de procédures de validation
  • Études de cas et applications pratiques de l'assurance de la qualité des données

Réduction de la dimensionnalité et sélection des caractéristiques

  • Comprendre la nécessité de la réduction de la dimensionnalité
  • Techniques telles que l'ACP (Analyse en Composantes Principales), la sélection des caractéristiques et les stratégies de réduction
  • Mise en œuvre des techniques de réduction de la dimensionnalité

Résumé et prochaines étapes

Pré requis

  • Compréhension de base des concepts liés aux données

Audience visée

  • Analystes de données
  • Administrateurs de bases de données
  • Professionnels de l'informatique
 14 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires