R Befehle mit Beispiel Flashcards
Wurzel ziehen von 4
sqrt(4)
3 hoch 4
3^4
Absoluter Betrag von 8
abs(8)
Objekt erstellen
Objekt
Def: Vektor
Eine Menge von Elementen (num, chr)
Def: Faktor
Variable mit Nominalskalenniveau
Def: Data-Frame
Ein Datensatz aus Vektoren und/oder Faktoren
Befehl: Combine
c(“Anführungszeichen”)
Befehl: Um welche Art Objekt handelt es sich?
Structure: str( )
Befehl: Objekte löschen
rm( )
Befehl: alle Objekte im Environment löschen
rm(list=ls( ))
Befehl: Arbeitsverzeichnis festlegen
setwd(“Pfad”)
Befehl: Arbeitsverzeichnis abfragen
getwd( )
Wann muss man das Arbeitsverzeichnis festlegen?
Bei jedem Start von R
B: Paket installieren
install.packages(“Anf.Zeichen”)
B: Paket laden (nach installation)
library( )
Wofür steht .csv?
Comma Seperated Values (zB. Excel)
B: Daten einlesen allgemein
read.table( header=T/F, sep=”\t”, dec=”./,/;”)
Bsp: Objekt “piraten” erstellen aus Datensatz piraten.txt. Erste Zeile Variablennamen, Tab-stop als Trennung, Punkt als Dezimaltrenner.
piraten PF read.table(file=”piraten.txt”, header=T, sep=”\t”, dec=”.”)
Bsp: Objekt “piraten” als .txt speichern mit Tab als Trenneinheit und ohne Zeilennummerierung
write.table( piraten, “neuerName.txt”, sep=”\t”, row.names=FALSE)
B: Objekte speichern als .txt
write.table( )
B: .RData einlesen
load(file=”datei.RData”)
B: Objekte in .RData-Format speichern
save(piraten, file=”neuerName.RData”)
B: Alle Objekte im Environment speichern
save.image(file=neuerName.RData”)
Was versteht man unter “wide format”?
Zeilen: Objekte Spalten: Variablen Gegenstück: “long format”
B: Datensatz in extra Fenster anschauen
View( )
B: Variablennamen aus Datensatz abfragen
names( )
B: Variablenklasse in “numeric” ändern
as.numeric(object$variable)
B: Variablenklasse in “character” ändern
as.character(object$variable)
B: Variablenklasse in “factor” ändern
as.factor(object$variable)
B: Variablenklasse in “factor” ändern, dabei aber “1” und “2” als “ja” und “nein” festlegen
factor(object$variable, levels=c(1, 2) labels=c(“ja”, “nein”))
B: Schreibweise “für >1 (1 bis höchste)
1:hi
Bsp: Umcodieren einer Variable in z.B. < 5 und 5 und ≥5
object$variableNEW
B: Umcodieren einer Variable
recode( )
Format für Subsetting
Eckige Klammern []
Bsp: Betrachte nur Spalte 3 (alle Zeilen)
object[,3]
Bsp: Betrachte in Spalte 5 die Zeilen 3 bis 30
object[3:30,5]
Richtige Reihenfolge für Spalten und Zeilen beim Subsetting?
object[Zeile, Spalte]
Bsp: Betrachte nur Spalte “Alter” und alle Zeilen ab Zeile 15
object[15:hi, “Alter”]
Nach dem Subsetting gibt das Programm einen modernisierten Datensatz aus. Wie heißt dieser Auszug aus dem ursprünglichen?
“tibble” z.B. aus object[1:15, “marke”]
B: Löschen der Variable in Spalte 2 (Durch Erstellen eines aktualisierten Datensatzes)
objectOhne PF object[,-2]
Löschen der Variablen in Spalte 4 und 5 (Durch Erstellen eines aktualisierten Datensatzes)
objectOhne PF object[,-c(4,5)]
Durch welches Symbol kann man in R “nicht” ausdrücken?
!
Durch welches Symbol kann man in R “gleichlautend” ausdrücken?
%in%
objectNeu PF object[,!names(object) %in% “X”]
“Nimm alle Variablen, deren Name nicht gleichlautend mit X ist”
Bsp: Geziehlt einen neuen Datensatz ohne Variable “Jahr” erstellen
objectNeu PF object[,!names(object) %in% “Jahr”]
Bsp: Geziehlt einen neuen Datensatz ohne Variablen “Jahr” und “Alter” erstellen
objectNeu PF object[,!names(object) %in% c(“Jahr”, “Alter”)]
Weiterer Befehl, um Variablen zu löschen
subset( )
Durch welches Symbol kann man in R “ist gleich” ausdrücken?
==
Bsp: Datensatz anlegen, in dem nur folgende Objekte vorkommen: Mit Variable ist gleich “Bio” (oder NA)
objectBIO PF object[object$variable==”Bio”,]
Bsp: Datensatz mithilfe von subset-Befehl erstellen, wo ‘Variable ist gleich “Bio”’ zutrifft (ohne fehlende Fälle)
subset(piraten, variable==”Bio”)
Bsp: Datensatz anlegen, in dem nur folgende Objekte vorkommen: Mit variable ist gleich “Bio” UND gesund größer als 3
objectBIOGes PF object[object$variable==”Bio” & object$variable (gr.als) 3 ,]
Durch welches Symbol kann man in R “und” ausdrücken?
& (und)
Durch welches Symbol kann man in R “oder” ausdrücken?
|
B: Abfragen, ob es fehlende Werte gibt
is.na( ) #Ausgabe als TRUE (es fehlt ein Wert) oder FALSE
B: Abfragen, welche Werte fehlen (zwei Befehle)
which(is.na(object))
B: Alle Fälle mit fehlenden Werten ausschließen
na.omit( )
Bsp: Eine neue Variable (Spalte) erstellen, die jeweils die Summe der Reihen (1-10) berechnet
rowSums(rosenberg[,c(1:10)])
super praktischer Befehl, um abzufragen ob es fehlende Werte gibt:
anyNA( )
B: Wie berechnen wir die Gefährlichkeit der Piraten, je nach Ausprägung der Variable meer?
Befehl aus dem psych-Paket
describeBy(piraten$gefahr, piraten$meer)
Mit welchem Befehl, neben describeBy( ) kann man z.B. den Mittelwert zwischen den Variablen ausgeben lassen?
z.B. zwischen
“gefahr” und “meer”
Man spezifiziert die Variable, auf die der Befehl anzuwenden ist, dann die Variable, nach deren Ausprägungen unterteilt werden soll, und zuletzt die Funktion:
by(piraten$gefahr, piraten$meer, mean, na.rm=T)
ggB: mit welchem Befehl kann man eine Zusammenfassung der Mittelwerte in Form eines Säulendiagrammes ausgeben lassen?
stat_summary(fun.y=mean, geom=”bar”)
B: Wie können wir mithilfe von R den Produkt-Moment-Korrelationskoeffizienten
Achtung: wir möchten nur Korrelation bei Werten berechnen, bei denen beiden Variablen ein Wert zugeteilt ist
cor(objekt$var1, objekt$var2, use=”pairwise.complete.obs”)
B: Wie geben wir eine Tabelle mit den Korrelationswerten dreier Variablen aus?
Auch hier sollen nur komplette Paare berechnet werden.
cor(objekt[c(“var1”, “var2”, “var3”)], use=”pairwise.complete.obs”)
B: Wie lassen wir die Berechnung einer Regressionsgerade ausgeben, die die Variable 1 anhand der Variable 2 voraussagt?
lm( objekt$var1 ~ objekt$var2)
Bsp: Wir möchten aus dem Datensatz piraten einen neuen Datensatz erstellen, der nur die Objekte mit der Variable meer gleich Nordpazifik enthält.
NeuesObj♦
piraten[piraten$meer==”Nordpazifik”,]
Bsp: Es wurde ein Ausreißerwert identifiziert (14 Schätze). Berechnen wir nun die Korrelation der beiden Variablen gefahr und schaetze unter Ausschluss des einzelnen Ausreißers.
Achtung: Nur paarweise vorhandene Variablen verwenden
cor(piraten_np$schaetze[piraten_np$schaetze!=14], piraten_np$gefahr[piraten_np$schaetze!=14], use=”pairwise.complete.obs”)
B: Wie können wir diesen Befehl so anpassen, dass der Objektträger mit schaetze=14 ausgeschlossen wird?
lm(piraten_np$schaetze ~ piraten_np$gefahr)
Bei beiden korrelierten Variablen muss durch Selektion der Wert ausgeschlossen werden ( ! = )
piraten_np$schaetze[piraten_np$schaetze!=14]
(Gleiches für $gefahr)
B: Wie erstellen wir eine Kreuztabelle?
CrossTable( )
CrossTable(piraten$schwimmen, piraten$besitzer_in)
B: mit welchem Befehl können wir den phi-Koeffizienten aus einer Tabelle zweier dichotomer Variablen berechnen?
phi( )
phi(table(piraten$schwimmen, piraten$besitzer_in))
Bsp: Wir möchten per Hand den phi-Koeffizienten berechnen. Aus der Kreuztabelle übernehmen wir die Werte in welcher Reihenfolge?
von links oben nach rechts unten
phi(c(22, 14, 18, 21))

Wie lautet der Befehl zur Bestimmung der Korrelation durch Spearman’s Rho?
cor(objekt$var1, objekt$var2, method=”spearman”, use=”pairwise.complete.obs”)