Un package c’est un ensemble de fonctions qui permettent de faire de la manipulation ou de la visualisation de données mais également de faire des analyses statistiques qui n’est pas disponible avec les packages R de base.
Les packages R dépendent souvent d’autres packages pour pouvoir fonctionner : les développeurs se basent sur des fonctions existantes afin d’éviter de tout encoder. C’est ce qu’on appelle les dépendances.
Quelques packages R de base :
Packages R utiles pour la data science :
Dplyr
Manipulation de gros tableaux de données
Ggplot2
Il permet de faire des graphiques
Plotly
Il rend les graphiques dynamiques
Caret, e1071, rpart, randomForest
Analyses statistiques dédiées à la data-science
Installer un package
Ici, c’est dplyr qui est installé, avec comme option l’installation de toutes ses dépendances.
- packages(«dplyr» , DEPENDANCIES=T)
- Après cela, il faut charger le package dans l’environnement R avec la fonction library(«dplyr»)