Pourquoi utiliser le R Langue?


Original: http://www.burns-stat.com/documents/tutorials/why-use-the-r-language/

 

 

 

 

 

 

Pourquoi utiliser le R Langue?

Cette habitude d’être appelé «Introduction à la S Langue”. R est un dialecte de la langue de S, et est venu à être – et de loin – le dialecte dominant.

Qu’est-ce que R et S?

S a commencé comme un projet de recherche Bell Labs il ya quelques décennies, il est un langage qui a été développé pour l’analyse des données, la modélisation statistique, la simulation et les graphiques. Cependant, il est une langue d’usage général avec quelques fonctionnalités puissantes – il pourrait (et fait) ont utilisations loin de l’analyse des données.

Il doit être utilisé pour de nombreuses tâches que les feuilles de calcul sont actuellement utilisés pour. Si une tâche n’est pas trivial à faire dans une feuille de calcul, puis presque toujours il serait plus productive (et en toute sécurité) être fait avec R. tableur toxicomanie parle de problèmes avec des feuilles de calcul et la façon dont R ​​est souvent un meilleur outil.

Pourquoi le S Langue?

  • S n’est pas seulement un ensemble de statistiques, c’est une langue.
  • S est conçu pour fonctionner de la façon dont les problèmes sont pensaient.
  • S est à la fois souple et puissant.

L’importance d’être une langue

Bien que la distinction entre un paquet et une langue est subtile, cette différence subtile a un impact énorme. Avec un package, vous pouvez effectuer un nombre défini de tâches – souvent avec quelques options qui peuvent être modifiés. Un langage vous permet de spécifier l’exécution de nouvelles tâches.

Votre réplique peut être: «Mais je ne voudra pas de créer une nouvelle forme de régression.” Oui, S ne vous permettent de créer de nouvelles formes de régression (et beaucoup de gens n’ont), mais S vous permet également d’effectuer facilement le même sorte de régression standard sur vos 5 jeux de données (ou c’est peut-être 500 jeux de données).

La clé est l’abstraction. Vous voyez facilement que vos 5 régressions sont vraiment la même – il est simplement données différents impliqués dans chaque. Dans votre esprit, vous avez soustrait les tâches spécifiques de sorte que tous se ressemblent. Une fois que vous avez vu l’abstraction, il est simple d’enseigner R l’abstraction. Les langues sont tout au sujet de l’abstraction.

Vous pouvez avoir une idée de la puissance du langage en ayant un oeil à la galerie de graphiques R.

La façon dont nous pensons

L’un des objectifs de la science, et que je pense a largement réussi, c’est que la langue doit refléter la façon dont les gens pensent. Un exemple simple: supposons que nous pensons que le poids est une fonction de (dépendant) de hauteur et en largeur. La formule S à exprimer ce n’est:

weight ~ height + girth

The + is not + as in addition, but + as in “and”.

Une autre caractéristique de S, c’est qu’il est un vecteur orienté – ce qui signifie que les objets sont généralement traitées comme un tout – que les humains ont tendance à penser de la situation – plutôt que comme une collection de numéros individuels. Supposons que nous voulons changer les hauteurs de pouces en centimètres. En S la commande pourrait être:

height.cm <- 2.54 * height.inches

Voici height.inches est un objet qui contient un certain nombre – un ou des millions – de hauteurs. S cache de l’utilisateur qu’il s’agit d’une série de multiplications, mais agit plutôt comme nous pensons – tout ce qui est en pouces, multiplier par 2,54 pour obtenir centimètres.

Expérience avec C ou Fortran peut ironiquement rendre plus difficile à utiliser efficacement S. Le C-avant-S gangs ont tendance à traduire le problème en «programmation» plutôt que de penser le problème de la manière «naturelle».

Paris est une fête

Flexibilité et la puissance abondent dans S. Par exemple, il est facile d’appeler C et C + + fonctionnalités de R. R n’insiste pas que tout est fait dans sa langue, de sorte que vous pouvez mélanger les outils – choisir le meilleur outil pour chaque tâche particulière.

Les morceaux de code qui sont écrites dans la langue de S sont toujours disponibles pour l’utilisateur, de sorte qu’un changement mineur à la tâche nécessite généralement qu’une modification mineure au code – un changement qui peut être réalisée en une petite quantité de temps.

Le moyen préféré

Compte tenu de ses qualités, R est devenu l’environnement informatique préféré pour une grande partie de la communauté statistique. Quand une nouvelle méthode statistique est inventé, il est probable qu’il sera mis en œuvre d’abord dans R.

En Mars 1999, John Chambers – l’un des initiateurs de S à Bell Labs – a reçu le prix ACM Software système. Il a déclaré, “S a changé à jamais la façon dont les gens analysent, de visualiser et de manipuler des données.” Les précédents lauréats de ce prix incluent Unix, TeX et le Web de World-Wide. John est maintenant un membre du R de base (le groupe qui produit R).

Apprenez R

«Impatient R” est un ensemble minimal de choses à apprendre sur R.

Quelques conseils pour les débutants de R” suggère des ressources supplémentaires pour apprendre R.