Ein Beispiel zum Schnelleinstieg
In diesem Kapitel werden Sie Schritt für Schritt dazu angeleitet, eine Analyse beispielhaft mit R durchzuführen. Es geht hier noch nicht darum, die einzelnen Schritte, Befehle oder alle berechneten Statistiken zu verstehen. Sie sollen hier lediglich einen Eindruck davon bekommen, wo die Reise Sie hinführen wird und wie der Umgang mit R sich anfühlt.
Das Einzige, was sie vorab hierzu erledigen müssen, ist R zu installieren. Laden Sie hierzu die R-Software von der Seite http://www.r.project.org. herunter und installieren sie diese. Eine ausführliche Anleitung zur Installation findet sich in Kapitel 2.
Um eine Analyse durchzuführen, benötigen wir Daten. Üblicherweise werden Sie dazu eigene Datensätze in R einlesen und verwenden, dazu (Kap. ). Alternativ können zu Übungszwecken auch Daten genutzt werden, die bereits in der R Software implementiert sind und so direkt genutzt werden können. Im Folgenden wird einer dieser Datensätze mit dem Namen genutzt.
Der Datensatz soll exploriert werden. Hierzu wird zunächst die Verteilung der einzelnen Variablen betrachtet. Im Anschluss werden diverse Regressionen gerechnet. Geben Sie folgende Befehle Schritt für Schritt in R ein und schauen Sie, was passiert. Der Text hinter der Raute () sind Kommentare, die nicht mit eingegeben werden müssen.
?attitude # Infos zum Datensatz
names(attitude) # Variablennamen anzeigen
head(attitude) # Die ersten Zeilen
attitude # Gesamten Datensatz ausgeben
# Explorative Datenanalyse ###
pairs(attitude) # Scatterplots aller Variablen
cor(attitude) # Korrelation aller Variablen
attach(attitude) # Datensatz verknüpfen
qqnorm(rating) # QQ-Diagramm von "rating"
qqline(rating) # Gerade hinzufügen
shapiro.test(rating) # Test auf Normalverteilung
qqnorm(complaints) # QQ-Diagramm von "rating"
qqline(complaints) # Gerade hinzufügen
shapiro.test(complaints) # Test auf Normalverteilung
# Regressionen rechnen #
m <- lm(rating ~ complaints) # Regression von "rating"
# auf "complaints"
summary(m) # Ergebnisse der Regression
plot(complaints, rating) # Scatterplot
abline(m, col="blue") # Regressiongrade
par(mfrow = c(2, 2)) # 2x2 Grafiken auf eine Seite
plot(m) # Regressionsdiagnostik
g <- lm(rating ~ ., data=attitude) # Alle Variablen aufnehmen
step(g) # Schrittweise Regression
detach(attitude) # Speicher aufräumen
Damit haben Sie ihre erste R Session abgeschlossen. Sie sollte einen Eindruck davon vermitteln, wie das Arbeiten mit R aussehen kann. In den Folgenden Kapiteln werden die einzelnen Befehle und deren Logik ausführlich besprochen.