Introduction à la programmation avec R pour l’analyse de données
Clientèle cible
- Ingénieurs
- Actuaires
- Statisticiens
- Scientifiques de données
- Chercheurs
- Analystes
- Toute personne qui souhaite s'initier à R pour effectuer de l'analyse de données et développer ses propres outils.
Préalables
Aucune connaissance de R n'est préalable, mais vous devez disposer de compétences de base en analyse statistique. De plus, la connaissance d'un autre langage de programmation ou d'un environnement statistique est un atout (par ex. : SAS, SPSS, Stata).
Description
Les fonctionnalités de R pour l’analyse de données, les statistiques et la visualisation, combinées au fait qu’il soit un logiciel libre, en font un allié naturel pour le traitement des données massives, tant dans les milieux scientifiques, qu’en entreprise.
La documentation sur l'utilisation de R en sciences naturelles, en sciences sociales, en finance, etc., ne manque pas. Cependant, peu de ressources se concentrent sur l'apprentissage du langage de programmation sous-jacent aux fonctionnalités statistiques. La maîtrise de celui-ci est pourtant essentielle pour bien comprendre le fonctionnement de R, être en mesure de concevoir ses propres outils d’analyse et poursuivre le développement de ses compétences. C’est ce que cette formation vous offre.
Afin de soutenir les participants dans leur apprentissage, le déroulement de la formation prévoit une alternance entre des exposés magistraux, des ateliers dirigés et des exercices de transfert.
Objectifs
- Utiliser l'environnement statistique R de manière interactive
- Utiliser le langage de programmation R pour résoudre des problèmes concrets
- Effectuer une analyse de données complète dans R
Contenu
- Bases du langage R : opérateurs de base, vecteurs, arithmétique vectorielle, indiçage, appels de fonctions, création de fonctions
- Structures de données : matrice, tableau (array), liste, tableau de données (data frame), facteur, date (classes Date, POSIXct, POSIXlt)
- Indiçage des les structures de données ci-dessus et transformations (fusion, réorganisation)
- Importation et exportation de tableaux de données
- Application (apply, lapply, sapply, mapply, tapply)
- Structures de contrôle : if ... else, for, while, repeat
- Installation et utilisation de paquetages externes
- Régression linéaire et graphiques simples (via des exemples additionnels)
Équipement requis
Les participants devront disposer d’un ordinateur muni des outils suivants :
- la plus récente version de R (https://cran.r-project.org/)
- la plus récente version de l’éditeur RStudio Desktop (version avec licence libre, https://posit.co/download/rstudio-desktop/)
Reconnaissance
Une attestation de participation reconnaissant les 15 heures de formation continue est décernée, après la formation, à chacun des participants qui respectent les conditions d'attestation.