Plan du cours
Jour 1 : Les bases du langage
- Introduction au cours
-
À propos de la science des données
- Définition de la science des données
- Processus de réalisation d'un projet en science des données.
- Présentation du langage R
- Variables et types de données
- Structures de contrôle (boucles / conditions)
-
Scalars, vecteurs et matrices dans R
- Définition des vecteurs R
- Matrices
-
Manipulation des chaînes de caractères
- Type de données caractère
- Entrées et sorties de fichiers (E/S)
- Listes
-
Fonctions
- Présentation des fonctions
- Fermetures (closures)
- Fonctions lapply et sapply
- DataFrames
- Travaux pratiques pour toutes les sections
Jour 2 : Programmation R intermédiaire
- DataFrames et E/S de fichiers
- Lecture de données à partir de fichiers
- Préparation des données
- Jeux de données intégrés
-
Visualisation
- Package graphics
- plot(), barplot(), hist(), boxplot(), nuage de points
- Carte thermique
- Package ggplot2 (qplot(), ggplot())
- Exploration avec Dplyr
- Travaux pratiques pour toutes les sections
Jour 3 : Programmation R avancée
-
Modélisation statistique avec R
- Fonctions statistiques
- Gestion des valeurs NA
- Distributions (binomiale, poissonienne, normale)
-
Régression
- Présentation de la régression linéaire
- Systèmes de recommandation
- Traitement de texte (package tm / nuages de mots)
-
Clustering (regroupement)
- Introduction au clustering
- KMeans
-
Classification
- Introduction à la classification
- Naive Bayes
- Arbres de décision
- Formation avec le package caret
- Évaluation des algorithmes
-
R et le Big Data
- Connexion de R aux bases de données
- Écosystème Big Data
- Travaux pratiques pour toutes les sections
Pré requis
- Une base en programmation est souhaitée
Configuration requise
- Un ordinateur portable récent
- RStudio à jour et environnement R installés
Nos clients témoignent (7)
Les applications dans la vie réelle utilisant Statcan et le CER comme exemples.
Matthew - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Ses connaissances et les codes étaient déjà écrits dans les fichiers, donc je pouvais étudier après les cours et m'entraîner par moi-même.
GLORIA ADANNE - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Beaucoup de codage R est fourni ainsi que d'excellents exemples
Kasia - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Langage très élaboré et bien développé. Une grande quantité d'informations de support sont également disponibles en ligne.
Michel - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
J'ai apprécié que le formateur s'assure que nous comprenions tous et suivions les cours. Si nous avions un problème, il s'arrêtait et nous aidait à le résoudre.
Cesar - AMERICAN EXPRESS COMPANY MEXICO
Formation - Data Analytics With R
Traduction automatique
The tool was interesting and I see the use. I would like to learn about more about it.
- Teleperformance
Formation - Data Analytics With R
Traduction automatique
New tool which is “R” and I find it interesting to know the existence of such tool for data analysis.
Michael Lopez - Teleperformance
Formation - Data Analytics With R
Traduction automatique