Un package R c’est quoi ?

Un package R c’est quoi ?

Un package c’est un ensemble de fonctions qui permettent de faire de la manipulation ou de la visualisation de données mais également de faire des analyses statistiques qui n’est pas disponible avec les packages R de base.

Les packages R dépendent souvent d’autres packages pour pouvoir fonctionner : les développeurs se basent sur des fonctions existantes afin d’éviter de tout encoder. C’est ce qu’on appelle les dépendances.

 

Quelques packages R de base :

Un package R c’est quoi ?

 

Packages R utiles pour la data science :

Dplyr
Manipulation de gros tableaux de données

Ggplot2
Il permet de faire des graphiques

Plotly
Il rend les graphiques dynamiques

Caret, e1071, rpart, randomForest
Analyses statistiques dédiées à la data-science

 

Installer un package

Ici, c’est dplyr qui est installé, avec comme option l’installation de toutes ses dépendances.

  1. packages(«dplyr» , DEPENDANCIES=T)
  2. Après cela, il faut charger le package dans l’environnement R avec la fonction library(«dplyr»)

Laisser un commentaire