Programmiersprache R Flashcards

1
Q

Warum ist R interessant zu lernen?

A

Weil es die meist genutzte Programmiersprache im Bereich Data Science ist mit einer großen Community und über 9000 Packages.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Ist R eine proprietäre Sprache?

A

Nein, R ist frei und open-source.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist besonders am Verhalten von R?

A

Es basiert in der Datenstruktur auf Vektoren. Daher können große Datenmengen ohne For-Loops oder ähnliche Schleifen nativ verarbeitet werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sieht man in der RStudio IDE?

A

Ein Skriptfenster mit dem Code von R und ein Konsolenfenster mit dem Output des Programms.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie kommentiert man Zeilen in R aus?

A

Mit # in der Zeile oder am Anfang.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie können Datensätze z.B. aus einer eingebauten Library in R geladen werden?

A

library(datasets)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie könnten in R Funktionen auf ein geladenes dataset angewandt werden?

A

head(iris) # Zeigt die ersten 6 rows der Daten
summary(iris) # Zeigt Statistiken für die Daten
plot(iris) # Zeigt einen Graphen für die Daten an

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Müssen in R geladene packages wieder detached werden und wenn ja wie?

A

Ja müssen sie mit

# Clear packages
detach("package:datasets", unload = TRUE)  # For base
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie können dargestellte plots wieder entfernt werden in R?

A

dev.off() # But only if there IS a plot

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was sind die Vorteile in der Nutzung von RStudio?

A

Befehle sind einheitlich
Das Interface zum Bedienen ist einheitlich
Das navigieren und verwalten von Code ist einfacher

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie kann man Zeilen in RStudio ausführen?

A

Mit STRG + ENTER in der selektierten Zeile

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Warum ist Datenanalyse in einer Programmiersprache wie R einer graphischen Anwendung wie Excel etc vorzuziehen?

A
  • Der Weg zum Ergebnis ist fest dokumentiert
  • Es können Fehler oder Ergänzungen für das Ergebnis identifiziert werden
  • Die Datenanalyse wird wieder nutzbar wenn sich Datensets in der Zukunft vergrößern
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind gängige Methoden in R?

A

mean(Attribut) # Durchschnitt
median(Attribut) # Median
hist(Attribut) # Plottet ein Histogramm
plot(Attribut ~ Attribut2) # Plotted zwei Attribute gegeneinander
cor.test(Attribut, Attribut2) # Testet Korrelation zwischen Attributen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was sind base Packages in R?

A

Packages welche schon von Haus aus mit der Installation von R verfügbar sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind contributed Packages in R?

A

Third-Party Packages welches man sich herunterladen und dann nutzen kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wo kann man sich contributed packages für R herunterladen?

A

CRAN (Comprehensive R Archive Network) https://cran.r-project.org/web/views/
Crantastic
GitHub
https://github.com/trending/r

17
Q

Wie werden Packages auf CRAN dargestellt?

A

In einer Task View, welche Packages in Themengebiete kategorisiert

18
Q

Was sind oft genutzte Packages für R?

A
dplyr (Dataframes manipulieren)
tidyr (Informationen cleaning up)
stringr (Mit Strings/Textinfo arbeiten)
lubridate (Datumsinfo bearbeiten)
httr (Websitedaten bearbeiten)
ggvis (Interaktive Visualizationen)
ggplot2 (Beliebt für Graphen/Plots)
shiny (Interaktive Apps für Websites)
rio (Importieren und exportieren von Daten)
rmarkdown (Interaktive Richdokuments/Notebooks)
pacman (One package to load them all)
19
Q

Wie können packages installiert werden?

A

Folgende Zeile runnen
install.packages(“pacman”)

Danach ist es nur auf der Festplatte verfügbar, aber ist nicht im Code nutzbar es muss noch geladen werden

20
Q

Wie können packages geladen werden?

A

require(pacman) # Gibt eine Bestätigung aus

library(pacman) # Keine Bestätigung

21
Q

Kann man pacman nutzen obwohl es noch nicht geladen ist?

A

Ja, pacman kann sich auch selbst ungeladen laden
Das geht über das :: Zeichen

pacman::p_load(pacman, dplyr, etc etc)

Damit downloaded es das package, lädt es und macht es verfügbar. Das ist wesentlich einfach als standardmäßig über R.

22
Q

Wie kann man alle packages wieder unloaden und damit cleanen?

A

p_unload(all) # Easier: clears all add-ons

23
Q

Wie kann man basic zweidimensioneles x-y plotting in R machen?

A

plot()

24
Q

Was ist in R besonders an dem plot() Befehl?

A
  • Datentypen werden automatisch angepasst
  • Anzahl der Variablen werden automatisch angepasst
  • Ob ein Barchart oder ein Graph für quantiative Werte genutzt werden soll kann R selber herausfinden
25
Q

Wie kann man in R Hilfe/Manual benutzen?

A

Ein Fragezeichen und dann der Befehl worüber die Frage geht

?plot # help for plot()

26
Q

Wie plotted man nur eine Kategorie/Aspekt in R?

A

Zuerst plot(dataset$kategorie)
plot(iris$Species)
plot(iris$Petal.Length)

27
Q

Wie können Daten aus Datensätzen gefiltert und angezeigt werden?

A

virginica 6)

tail(sepalLength6) # compare this to head()