Plan du cours
I. Introduction et préliminaires
1. Vue d'ensemble
- Rendre R plus convivial, R et les interfaces graphiques disponibles
- Rstudio
- Logiciels connexes et documentation
- R et les statistiques
- Utiliser R de manière interactive
- Une session d'introduction
- Obtenir de l'aide sur les fonctions et les caractéristiques
- Commandes R, sensibilité à la casse, etc.
- Rappel et correction des commandes précédentes
- Exécution de commandes à partir d'un fichier ou détournement de la sortie vers un fichier
- Permanence des données et suppression d'objets
- Go Pratique de la programmation : scripts autonomes, bonne lisibilité, par exemple scripts structurés, documentation, markdown
- installation de paquets ; CRAN et Bioconductor
2. Lecture des données
- Fichiers Txt (read.delim)
- Fichiers CSV
3. Manipulations simples ; nombres et vecteurs + tableaux
- Vecteurs et affectation
- Arithmétique vectorielle
- Génération de séquences régulières
- Vecteurs logiques
- Valeurs manquantes
- Vecteurs de caractères
- Vecteurs d'index ; sélection et modification de sous-ensembles d'un ensemble de données- Tableaux
 
- Indexation des tableaux. Sous-sections d'un tableau
- Matrices d'indexation
- La fonction array() + les opérations simples sur les tableaux, par exemple la multiplication, la transposition.
- Autres types d'objets
4. Listes et cadres de données
- Les listes
- Construction et modification de listes- Concaténation de listes
 
- Cadres de données- Création de cadres de données
- Travailler avec des cadres de données
- Attacher des listes arbitraires
- Gestion du chemin de recherche
 
5. Manipulation des données
- Sélection, sous-ensemble d'observations et de variables
- Filtrage, regroupement
- Recodage, transformations
- Agrégation, combinaison d'ensembles de données
- Formation de matrices partitionnées, cbind() et rbind()
- La fonction de concaténation, (), avec les tableaux
- Manipulation de caractères, paquetage stringr
- brève introduction à grep et regexpr
6. En savoir plus sur la lecture de données
- Fichiers XLS, XLSX
- paquets readr et readxl
- Données SPSS, SAS, Stata,... et autres formats
- Exporter des données vers txt, csv et d'autres formats
6. Groupement, boucles et exécution conditionnelle
- Expressions groupées
- Instructions de contrôle
- Exécution conditionnelle : instructions if
- Exécution répétitive : boucles for, repeat et while
- Introduction à apply, lapply, sapply, tapply
7. Les fonctions
- Création de fonctions
- Arguments facultatifs et valeurs par défaut
- Nombre variable d'arguments
- Portée et ses conséquences
8. Graphiques simples en R
- Création d'un graphique
- Graphiques de densité
- Graphiques en points
- Graphiques à barres
- Graphiques linéaires
- Graphiques circulaires
- Diagrammes en boîte
- Diagrammes de dispersion
- Combinaison de graphiques
II. Analyse statistique dans R
1. Distributions de probabilités
- R en tant qu'ensemble de tableaux statistiques
- Examen de la distribution d'un ensemble de données
2. Tests d'hypothèses
- Tests concernant la moyenne d'une population
- Test du rapport de vraisemblance
- Tests à un et deux échantillons
- Test d'ajustement du chi-carré Goodness-of-fit
- Statistique de Kolmogorov-Smirnov à un échantillon
- Test de Wilcoxon Signé-Rank
- Test à deux échantillons
- Test de la somme des rangs de Wilcoxon
- Test de Mann-Whitney
- Test de Kolmogorov-Smirnov
3. Tests multiples d'hypothèses
- Erreur de type I et FDR
- Courbes ROC et AUC
- Procédures de tests multiples (BH, Bonferroni, etc.)
4. Modèles de régression linéaire
- Fonctions génériques pour l'extraction d'informations sur les modèles
- Mise à jour des modèles ajustés
- Modèles linéaires généralisés- Familles
- La fonction glm()
 
- Classification- Régression logistique
- Analyse discriminante linéaire
 
- Apprentissage non supervisé- Analyse des composantes principales
- Méthodes de clustering (k-means, clustering hiérarchique, k-medoids)
 
5. Analyse de survie (survival package)
- Objets de survie dans r
- Estimation de Kaplan-Meier, test de log-rank, régression paramétrique
- Bandes de confiance
- Analyse de données censurées (intervalle censuré)
- Modèles PH de Cox, covariables constantes
- Modèles PH de Cox, covariables dépendantes du temps
- Simulation : Comparaison de modèles (comparaison de modèles de régression)
6. Analyse de la variance
- ANOVA à une voie
- Classification de l'ANOVA à deux voies
- MANOVA
III. Problèmes pratiques en bioinformatique
- Brève introduction au paquet limma
- Flux de travail pour l'analyse des données de microréseaux
- Téléchargement des données à partir de GEO : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Traitement des données (QC, normalisation, expression différentielle)
- Tracé de volcan
- Exemples de clustering + heatmaps
Nos clients témoignent (5)
C'était instructif et utile
Brenton - Lotterywest
Formation - Building Web Applications in R with Shiny
Traduction automatique
L'implication de la formatrice, bonne préparation du sujet.
Bruno Scibilia - Lesaffre International
Formation - Advanced R Programming
Le rythme était parfait et l'atmosphère détendue a permis aux candidats de se sentir à l'aise pour poser des questions.
Rhian Hughes - Public Health Wales NHS Trust
Formation - Introduction to Data Visualization with Tidyverse and R
Traduction automatique
le sujet a été bien présenté et de manière ordonnée.
Marylin Houle - Ivanhoe Cambridge
Formation - Introduction to R with Time Series Analysis
Traduction automatique
It was very informative and professionally held. Wojteks knowledge level was so advanced that he could basically answer any question and he was willing to put effort into fitting the training to my personal needs.
Sonja Steiner - BearingPoint GmbH
Formation - R Programming for Data Analysis
Traduction automatique
