Plan du cours
Jour Un : Bases du langage
- Introduction au cours
-
À propos de la science des données
- Définition de la science des données
- Processus de réalisation de la science des données
- Présentation du langage R
- Variables et types
- Structures de contrôle (boucles / conditions)
-
Scalaires, vecteurs et matrices en R
- Définition des vecteurs en R
- Matrices
-
Manipulation de chaînes et de texte
- Type de données caractère
- Lecture/écriture de fichiers
- Listes
-
Fonctions
- Introduction aux fonctions
- Closures
- Fonctions lapply/sapply
- DataFrames
- Laboratoires pour toutes les sections
Jour Deux : Programmation intermédiaire avec R
- DataFrames et lecture/écriture de fichiers
- Lecture de données à partir de fichiers
- Préparation des données
- Jeux de données intégrés
-
Visualisation
- Package Graphics
- plot() / barplot() / hist() / boxplot() / scatter plot
- Heat Map
- Package ggplot2 (qplot(), ggplot())
- Exploration avec Dplyr
- Laboratoires pour toutes les sections
Jour Trois : Programmation avancée avec R
-
Modélisation statistique avec R
- Fonctions statistiques
- Gestion des valeurs NA
- Distributions (Binomiale, Poisson, Normale)
-
Régression
- Introduction aux régressions linéaires
- Recommandations
- Traitement de texte (package tm / nuages de mots)
-
Clustering
- Introduction au clustering
- KMeans
-
Classification
- Introduction à la classification
- Naive Bayes
- Arbres de décision
- Formation avec le package caret
- Évaluation des algorithmes
-
R et Big Data
- Connexion de R aux bases de données
- Écosystème du Big Data
- Laboratoires pour toutes les sections
Pré requis
- Une connaissance de base en programmation est préférée
Configuration
- Un ordinateur portable moderne
- La dernière version de R Studio et de l'environment R installés
Nos clients témoignent (7)
Les applications réelles en utilisant Statcan et CER comme exemples.
Matthew - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Ses connaissances et les codes étaient déjà inscrits dans les fichiers, ce qui m'a permis d'étudier après les cours et de pratiquer par moi-même.
GLORIA ADANNE - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Beaucoup de codage R fourni et de bons exemples
Kasia - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Langue étendue et bien développée. De nombreuses informations complémentaires sont également disponibles en ligne.
Michel - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
J'ai apprécié que le formateur s'assure que nous comprenions et suivions tous les cours. Si nous avions un problème, il s'arrêtait et nous aidait à le résoudre.
Cesar - AMERICAN EXPRESS COMPANY MEXICO
Formation - Data Analytics With R
Traduction automatique
The tool was interesting and I see the use. I would like to learn about more about it.
- Teleperformance
Formation - Data Analytics With R
Traduction automatique
New tool which is “R” and I find it interesting to know the existence of such tool for data analysis.
Michael Lopez - Teleperformance
Formation - Data Analytics With R
Traduction automatique