Introduction à la programmation avec R pour l’analyse de données

Programmation Science des données
Durée
14 heures
Formules d'enseignement
En salle En ligne
Formation publique Formation pour entreprise

Clientèle cible

  • Ingénieurs
  • Actuaires
  • Statisticiens
  • Scientifiques de données
  • Chercheurs
  • Analystes
  • Toute personne qui souhaite s'initier à R pour effectuer de l'analyse de données et développer ses propres outils.

Préalables

Aucune connaissance de R n'est préalable, mais vous devez disposer de compétences de base en analyse statistique. De plus, la connaissance d'un autre langage de programmation ou d'un environnement statistique est un atout (par ex. : SAS, SPSS, Stata).

Description

Les fonctionnalités de R pour l’analyse de données, les statistiques et la visualisation, combinées au fait qu’il soit un logiciel libre, en font un allié naturel pour le traitement des données massives, tant dans les milieux scientifiques, qu’en entreprise.

La documentation sur l'utilisation de R en sciences naturelles, en sciences sociales, en finance, etc., ne manque pas. Cependant, peu de ressources se concentrent sur l'apprentissage du langage de programmation sous-jacent aux fonctionnalités statistiques. La maîtrise de celui-ci est pourtant essentielle pour bien comprendre le fonctionnement de R, être en mesure de concevoir ses propres outils d’analyse et poursuivre le développement de ses compétences. C’est ce que cette formation vous offre. 

Afin de soutenir les participants dans leur apprentissage, le déroulement de la formation prévoit une alternance entre des exposés magistraux, des ateliers dirigés et des exercices de transfert.

Objectifs

  • Utiliser l'environnement statistique R de manière interactive
  • Utiliser le langage de programmation R pour résoudre des problèmes concrets
  • Effectuer une analyse de données complète dans R

Contenu

  • Bases du langage R : opérateurs de base, vecteurs, arithmétique vectorielle, indiçage, appels de fonctions, création de fonctions
  • Structures de données : matrice, tableau (array), liste, tableau de données (data frame), facteur, date (classes Date, POSIXct, POSIXlt)
  • Indiçage des les structures de données ci-dessus et transformations (fusion, réorganisation)
  • Importation et exportation de tableaux de données
  • Application (apply, lapply, sapply, mapply, tapply)
  • Structures de contrôle : if ... else, for, while, repeat
  • Installation et utilisation de paquetages externes
  • Régression linéaire et graphiques simples (via des exemples additionnels)


Équipement requis

Les participants devront disposer d’un ordinateur muni des outils suivants :