Programmiersprache R Flashcards
Warum ist R interessant zu lernen?
Weil es die meist genutzte Programmiersprache im Bereich Data Science ist mit einer großen Community und über 9000 Packages.
Ist R eine proprietäre Sprache?
Nein, R ist frei und open-source.
Was ist besonders am Verhalten von R?
Es basiert in der Datenstruktur auf Vektoren. Daher können große Datenmengen ohne For-Loops oder ähnliche Schleifen nativ verarbeitet werden.
Was sieht man in der RStudio IDE?
Ein Skriptfenster mit dem Code von R und ein Konsolenfenster mit dem Output des Programms.
Wie kommentiert man Zeilen in R aus?
Mit # in der Zeile oder am Anfang.
Wie können Datensätze z.B. aus einer eingebauten Library in R geladen werden?
library(datasets)
Wie könnten in R Funktionen auf ein geladenes dataset angewandt werden?
head(iris) # Zeigt die ersten 6 rows der Daten
summary(iris) # Zeigt Statistiken für die Daten
plot(iris) # Zeigt einen Graphen für die Daten an
Müssen in R geladene packages wieder detached werden und wenn ja wie?
Ja müssen sie mit
# Clear packages detach("package:datasets", unload = TRUE) # For base
Wie können dargestellte plots wieder entfernt werden in R?
dev.off() # But only if there IS a plot
Was sind die Vorteile in der Nutzung von RStudio?
Befehle sind einheitlich
Das Interface zum Bedienen ist einheitlich
Das navigieren und verwalten von Code ist einfacher
Wie kann man Zeilen in RStudio ausführen?
Mit STRG + ENTER in der selektierten Zeile
Warum ist Datenanalyse in einer Programmiersprache wie R einer graphischen Anwendung wie Excel etc vorzuziehen?
- Der Weg zum Ergebnis ist fest dokumentiert
- Es können Fehler oder Ergänzungen für das Ergebnis identifiziert werden
- Die Datenanalyse wird wieder nutzbar wenn sich Datensets in der Zukunft vergrößern
Was sind gängige Methoden in R?
mean(Attribut) # Durchschnitt
median(Attribut) # Median
hist(Attribut) # Plottet ein Histogramm
plot(Attribut ~ Attribut2) # Plotted zwei Attribute gegeneinander
cor.test(Attribut, Attribut2) # Testet Korrelation zwischen Attributen
Was sind base Packages in R?
Packages welche schon von Haus aus mit der Installation von R verfügbar sind
Was sind contributed Packages in R?
Third-Party Packages welches man sich herunterladen und dann nutzen kann
Wo kann man sich contributed packages für R herunterladen?
CRAN (Comprehensive R Archive Network) https://cran.r-project.org/web/views/
Crantastic
GitHub
https://github.com/trending/r
Wie werden Packages auf CRAN dargestellt?
In einer Task View, welche Packages in Themengebiete kategorisiert
Was sind oft genutzte Packages für R?
dplyr (Dataframes manipulieren) tidyr (Informationen cleaning up) stringr (Mit Strings/Textinfo arbeiten) lubridate (Datumsinfo bearbeiten) httr (Websitedaten bearbeiten) ggvis (Interaktive Visualizationen) ggplot2 (Beliebt für Graphen/Plots) shiny (Interaktive Apps für Websites) rio (Importieren und exportieren von Daten) rmarkdown (Interaktive Richdokuments/Notebooks) pacman (One package to load them all)
Wie können packages installiert werden?
Folgende Zeile runnen
install.packages(“pacman”)
Danach ist es nur auf der Festplatte verfügbar, aber ist nicht im Code nutzbar es muss noch geladen werden
Wie können packages geladen werden?
require(pacman) # Gibt eine Bestätigung aus
library(pacman) # Keine Bestätigung
Kann man pacman nutzen obwohl es noch nicht geladen ist?
Ja, pacman kann sich auch selbst ungeladen laden
Das geht über das :: Zeichen
pacman::p_load(pacman, dplyr, etc etc)
Damit downloaded es das package, lädt es und macht es verfügbar. Das ist wesentlich einfach als standardmäßig über R.
Wie kann man alle packages wieder unloaden und damit cleanen?
p_unload(all) # Easier: clears all add-ons
Wie kann man basic zweidimensioneles x-y plotting in R machen?
plot()
Was ist in R besonders an dem plot() Befehl?
- Datentypen werden automatisch angepasst
- Anzahl der Variablen werden automatisch angepasst
- Ob ein Barchart oder ein Graph für quantiative Werte genutzt werden soll kann R selber herausfinden
Wie kann man in R Hilfe/Manual benutzen?
Ein Fragezeichen und dann der Befehl worüber die Frage geht
?plot # help for plot()
Wie plotted man nur eine Kategorie/Aspekt in R?
Zuerst plot(dataset$kategorie)
plot(iris$Species)
plot(iris$Petal.Length)
Wie können Daten aus Datensätzen gefiltert und angezeigt werden?
virginica 6)
tail(sepalLength6) # compare this to head()