Grafiken mit ggplot2 Flashcards
Wie lauten die ersten beiden Zeilen für diesen Graphen?
Dargestellt sind aus Daten aus “Piraten”
Variablen “meer” und “geschlecht”
(Die Geschlechter sollen nebeneinander dargestellt werden, statt gestapelt)

ggplot(Piraten) +
geom_bar(position=”dodge”, aes(x=meer, fill=geschlecht))
Beispiel Funktion für Label auf beiden Achsen und einem Titel:
labs(title=”Großer Titel”, x=”Meere”, y=”Anzahl”)
Wie passe ich die Texte und Zahlen auf beiden Achsen an und verändere Farbe, Größe, etc?
theme(axis.text.x = element_text(size=17),
axis.text.y = element_text(size=16, color=”brown”),
axis.title.x = element_text(color=”purple”),
axis.title.y = element_text(colour=”red”),
legend.title = element_text(angle=21),
)

Wie skaliere ich die Y-Achse von 0 bis 20 in zweier-Schritten?
scale_y_continuous(breaks=seq(0,20,2))
Wie verändere ich manuell die Farben in der Legende einer Faktorvariable (z.B. Geschlecht)?
scale_fill_manual(breaks=c(“d”, “m”, “w”),
labels=c(“divers”, “männlich”, “weiblich”),
values=c(“darkgreen”, “white”, “red”))
Wie erstelle ich ein Säulendiagramm, in dem die x-Achse die Variable “meer” darstellt und die Füllfarben die Geschlechterverteilung gestapelt angeben?
geom_bar(position=”stack”, aes(x=meer, fill=geschlecht))
Wie erstelle ich ein Säulendiagramm, in dem die x-Achse die Variable “meer” darstellt und die Geschlechterverteilung nebeneinander angeben?
geom_bar(position=”dodge”, aes(x=meer, fill=geschlecht))
Zwei Möglichkeiten, einen Titel zum Diagramm hinzuzufügen:
- ggtitle(“Aufteilung…”)
- labs( x=”Meer”, y=”Häufigkeit”, title=”Aufteilung der Werte” )
Zwei Möglichkeiten, die Label zu verändern:
- xlab( ) _ ylab( ) _ ggtitle( )
- labs(x=”—”, y=”—”, title=”—”)
Befehl zum Speichern einer Grafik mit ggplot
ggsave(“Dateiname.jpg”)
Die Endung wird automatisch erkannt und entsprechend exportiert
Befehl zum “flippen” des Koordinatensystems
(Querlegen, Balken statt Säulen, etc.)
coord_flip( )
Wie kann man innerhalb eines Titels einen Zeilenumbruch hinzufügen?
\n
Wie geben wir dem Plot einen Titel mit Untertitel?
ggtitle( “Titel”, subtitle=”Untertitel in kleinerer Schrift” )
Wie fügen wir zu einem Boxplot die “Whiskers” hinzu?
stat_boxplot(geom=errorbar, width=|Wert von 0:1|
Wie lautet der Befehl, um einen Boxplot zu erstellen?
geom_boxplot( )
Wie können wir verhindern, dass statt nur für “ja” und “nein” ein dritter Faktor auf der x-Achse für “NA” angefügt wird?
ggplot(Objekt[! is.na (Objekt$variableX),] , aes(variableX, variableY)
Welche zwei Schritte muss man beachten, um einen “kompletten” Boxplot mit Whiskers zu erhalten?
- geom_boxplot( ) +
- stat_boxplot(geom=”errorbar”, width=Wertbis1)
Ein Wert von 1 bedeutet Whiskers so breit wie der Boxplot selbst
Wie lautet der Befehl für eine Regressionsgerade durch einen Scatterplot?
geom_smooth( )
Wie lautet der Befehl für ein Punktdiagramm (Scatterplot) ohne fehlende Werte?
geom_point(na.rm=T)
Wie fülle ich die Punkte in einem Scatterplot mit Farben entsprechend einer dritten Variable?
z.B. Geschlecht
ggplot(Objekt, aes(var1, var2, color=var3)
Wie verändere ich die Label in der Legende bei Kategorien d, m, w?
divers, männlich, weiblich in drei gewählten Farben und Überschrift “Geschlecht”
scale_color_manual(
values=c(“red”, “green”, “blue”),
breaks=c(“d”, “m”, “w”),
labels=c(“divers”, “männlich”, “weiblich”),
name=”Geschlecht”
)
Was ist der Unterschied zwischen einem einfachen Scatterplot und einem gruppierten Scatterplot?
- Der einfache Plot zeigt die Korrelation zwischen zwei Variablen
- Der gruppierte Plot gibt zusätzlich Auskunft über weitere Variablen
(z. B. durch Einfärbung, verschiedene Formen, …)
Beim Befehl für die Regressionsgerade wirft das Programm zusätzlich den Konfidenzintervall aus. Wie entfernen wir diesen?

geom_smooth(na.rm=T, method=”lm”, se=FALSE)
Wie generieren wir eine Regressionslinie mit dem “smooth” Befehl?
geom_smooth(na.rm=T, method=”lm”, se=F)
“lm” steht für linear model
An Welcher Stelle im Code können wir für unseren Scatterplot die Form, Farbe, Größe etc. festlegen?
geom_point(na.rm=T, color=”red”, shape=2, size=3)
Direkt in der Diagramm-Ebene
An welcher Stelle im Code können wir die Werte im Scatterplot zufällig um ihren eigentlichen Punkt anordnen, um Überlappungen zu vermeiden?
geom_point(na.rm=T, position=”jitter”, color=”red”, shape=2, size=3)
Direkt in der Diagramm-Ebene
Welche Möglichkeiten gibt es, mit dem cor( ) - Befehl die Korrelation zu berechnen?
- Pearson (standard)
- Kendall’s Tau (kendall)
- Spearman’s Rho (spearman)
cor(piraten$gefahr, piraten$schiffe, method=”kendall”, use=”pairwise.complete.obs”)