Pour quelles opérations utiliser le logiciel R ?
En informatique ou dans le domaine de la planification statistique, R se définit comme un langage de programmation et un logiciel libre. Ce programme est destiné aux statistiques et à la science des données soutenues. Il est utilisé pour de nombreuses opérations, les unes relatives aux opérations de traitement statistique des données et les autres, aux opérations de programmation de script interprété. Ici, nous clarifions les opérations relatives au traitement statistique de données avant d’évoquer celles relatives à la programmation.
R, un logiciel adapté aux opérations de traitement statistique des données
Fonctionnant sous la forme d’un interpréteur de commandes, le logiciel R dispose d’une bibliothèque très large de fonctions statistiques. Sa bibliothèque est si riche en fonctions statistiques qu’il est possible d’en intégrer de nouvelles par le système des « packages ». Il en est de même pour des modules externes compilés sous forme de DLL sous Windows que l’on peut télécharger sur internet. À cela, s’ajoute une palette étendue d’opérations à fonctionnalités graphiques adaptées à un traitement smp réalisable à l’aide de data miners. Quatre fonctions novatrices permettent de réaliser des avancées notables dans la description de données et la mise en exécution du programme R . Il s’agit de :
- la fonction ‘‘df_status’’ qui facilite l’obtention du nombre de valeurs nulles, de valeurs infinies, de valeurs manquantes et le type des variables
- la fonction ‘‘profiling_num’’ qui détermine et calcule tous les paramètres classiquement utilisés pour décrire les données numériques
- la fonction ‘‘plot_num’’ qui permet d’avoir en un temps record une visualisation des distributions de toutes les variables et
- la fonction “freq” qui favorise l’obtention des paramètres descriptifs des variables catégorielles ou facteurs.
R, un outil simple pour la mise en œuvre des opérations de programmation de script interprété
Le logiciel R est un langage de programmation de script interprété qui dérive du S qui, à son tour est disponible dans le logiciel S-PLUS. C’est en cela qu’il intègre les caractéristiques de ce dernier à savoir : données simples et structurées, opération d’entrée-sortie, branchements conditionnels, boucles indicées et conditionnelles, récursivité. Ces caractéristiques permettent d’utiliser le logiciel R pour mettre facilement en place des opérations de programmation de script interprété.
Le programme R est facile à manipuler d’autant plus qu’il permet même à un enfant sans grande formation dans le domaine statistique d’effectuer la rédaction de rapports. Ainsi, toute personne peut intégrer au logiciel un texte et un code avec une table ou grâce à des tableaux à frame rangés par column-major order.