Lancé en 1993 sur les bases du langage S, R est vite devenu l'outil préféré de tous les analystes et statisticiens de la planète. Nous allons nous pencher sur ce langage informatique et son impact sur l'analyse des données.
Un langage adapté à l'analyse statistique
R est un langage informatique qui est plus tourné vers l'analyse des données et les statistiques . Le langage R est inspiré en grande partie du langage S.
Le principal avantage du langage R sur le langage S est son côté libre. En effet, R est réservé à un plus large public. Cela permet un peu de démocratiser le langage et de le rendre accessible à monsieur tout le monde.
Le langage R n'est pas seulement l'enfant du système S. C'est également un langage informatique puissant pour des applications statistiques et mathématiques. D'ailleurs, les développeurs du langage l'ont créé surtout dans ce but.
Voici une liste non exhaustive des points forts intéressants du langage R :
- Il n'y a pas de déclaration ou de typage obligatoire des variables
- Les temps de développement sont très courts, généralement on a juste besoin de quelques lignes de code pour exécuter des opérations et analyser des datas
- Le langage R est fondé sur le principe vectoriel. Cela implique que les opérations mathématiques sont simplifiées et que cela évite au maximum l'utilisation des fameuses structures itératives
En gros, il faut retenir que le langage R est un système où les tableaux , les vecteurs les matrices et les listes sont les objets les plus utilisés pour la programmation. Néanmoins, certaines procédures statistiques comme la régression linéaire utilisent surtout les datas frames (tableaux de données).
Quelle interface pour le langage R ?
Le langage R dispose d'une invite de commande qui n'est pas très différente de celle que peut présenter d'un tableur Excel.
L'aspect peut varier selon le système d'exploitation de l'ordinateur. Ainsi :
- Sous Mac os X l'interface graphique du langage R est plus élaborée et plus esthétique. On retrouve non seulement une console similaire à celle d'un tableur Excel mais également toute une panoplie de fonction et un éditeur de code qui n'a rien à envier à la concurrence
- Sous Windows, l'interface graphique est austère et limitée. Toutefois, elle est très pratique pour les opérations type installation de package externe
- Avec Linux et Unix, le langage R est accessible uniquement via l'invite de commande du terminal (système d'exploitation). On note aussi ici une absence d'interface graphique
Il faut souligner que quel que soit le système d'exploitation de votre ordinateur (sauf peut-être dans le cas de Mac Os X), l'idéal est d'utiliser le langage R via un éditeur de texte intégré.
Certaines versions du langage R comme le logiciel R++ mettent l'accent sur la convivialité. En effet, ce programme dispose d'une interface homme machine qui est adaptée à quelqu'un qui n'est pas programmeur. C'est particulièrement utile lorsque l'opérateur est un statisticien aux notions informatiques très limitées. Plus besoin de suivre une formation en programmation pour utiliser un langage informatique.
R++ s'est également distingué par sa rapidité de calcul. Les experts estiment que ce logiciel est jusqu'à 800 fois plus rapide que les versions précédentes.