Le passage de SAS vers R
Clientèle cible
Cette formation s'adresse aux gens qui utilisent actuellement SAS et qui souhaitent effectuer une transition vers R (ingénieurs, actuaires, statisticiens, scientifiques de données, chercheurs, analystes, etc.).
La formation exige une connaissance préalable de base de SAS, ainsi qu’une familiarité avec l’analyse de données. Aucune connaissance préalable de R n’est requise. La connaissance d'autres langages de programmation ou environnements statistiques (par exemple: SPSS, Stata) est un atout.
Description
Plusieurs organisations entreprennent une migration stratégique depuis la plateforme de calcul statistique SAS vers le logiciel libre R.
Cette formation est destinée aux personnes qui désirent s’initier à R, être en mesure de programmer avec ce langage et, à terme, remplacer leurs analyses SAS par des analyses R équivalentes.
Les techniques seront illustrées à l’aide d’exemples tirés de différentes disciplines.
Afin de soutenir les participants dans leur apprentissage, le déroulement de la formation prévoit une alternance entre les notions théoriques et les périodes d'exercices dirigés.
Objectifs
Au terme de cette formation, le participant sera en mesure d’utiliser le langage R pour effectuer de l’analyse de données, développer ses propres outils et remplacer ses analyses SAS par des analyses R équivalentes.
Objectifs spécifiques
À la fin de la formation, le participant sera capable de :
- Utiliser l'environnement statistique R de manière interactive
- Utiliser le langage de programmation R pour résoudre des problèmes concrets
- Effectuer une analyse de données complète dans R
- Convertir le script d’une analyse SAS vers un script R équivalent
Contenu
Calendrier détaillé
SÉANCE 1 – MISE EN PLACE
Séance synchrone (2h45):
- Introduction
- Présentation de l’analyse de données
- Analyse de données : solution avec SAS
- R vs SAS
- Présentation de R
- Anatomie d’une session de travail avec R
Atelier pratique autonome (30 minutes):
- Atelier presentation.R
SÉANCE 2 – BASES DU LANGAGE R
Séance synchrone (1h30):
- Arithmétique vectorielle et indiçage
- Statistiques descriptives (R vs SAS)
Atelier pratique autonome (1 heure):
- Atelier arithmétique.R
- Atelier statistiques.R
Exercices autonome (1h00)
SÉANCE 3 – FONCTIONS ET STRUCTURES DE DONNÉES
Séance synchrone (1h15):
- Programmation fonctionnelle
- Structures de données
Atelier pratique autonome (1 heure):
- Atelier fonctions.R
- Atelier donnees.R
Exercices autonome (1h15)
SÉANCE 4 – IMPORTATION, EXPORTATION ET APPLICATION
Séance synchrone (1h15):
- Importation et exportation de données
- Fonctions d’application
Atelier pratique autonome (45 minutes) :
- Atelier import-export.R
- Atelier application.R
Exercices autonome (1h30)
SÉANCE 5 – CONCEPTS AVANCÉS
Séance synchrone (2h):
- Structures de contrôle
- Extensions
- Sujets avancés
Atelier pratique autonome (1h):
- Atelier contrôle.R
- Atelier extensions.R
Exercices autonome (30 minutes)
SÉANCE 6 – ANALYSE DE DONNÉES ET CLÔTURE
Séance synchrone (2h30):
- Solution de l’analyse de données
- Graphiques
- Synthèse
- Outils pour la science reproductible (R Markdown, Shiny, gestion des versions)
Matériel requis
Les participants devront disposer d’un ordinateur muni des outils suivants :
- la plus récente version de R (https://cran.r-project.org/)
- la plus récente version de l’éditeur RStudio Desktop (version avec licence libre, https://rstudio.com/products/rstudio/download/)
Reconnaissance
Une attestation de participation reconnaissant les 20 heures de formation continue est décernée, après la formation, à chacun des participants qui respectent les conditions d'attestation.