Basics Flashcards
Bias
systematischer Fehler, mögliche Verzerrung
Streuung
wie unterschiedlich Daten sind oder wie nahe sie am Mittelpunkt liegen
Verteilung
Auflistung der möglichen Werte einer Variable, Intervalle von Werten
Binomialverteilung
zwei Ausprägungen, Ja/Nein, 0/1 etc.
Normalverteilung
Kirchturmglocke; häufigster Wert in der Mitte, die anderen Werte verteilen sich gleichmäßig links und rechts
p-Wert
wir bei Hypothesentests verwendet um das Gewicht des Beweises zu bemessen. Liegt zwischen 0 und 1, ist p-Wert klein, spricht das gegen H0
Korrelation
stellt die Stärke und Richtung zwischen zwei numerischen Variablen fest und erklärt, ob ein linearer Zusammenhang besteht
Kausalzusammenhang
wird eine Variable verändert (x), dann ändert sich auch die zweite Variable (y)
t-Verteilung
beruht auf Mittelwert von wenigen Daten
Konfidenzintervall
Wert liegt mit x-Wahrscheinlichkeit innerhalb dieses Intervalls (meist 95%)
Hypothesentest
Verfahren, in dem Daten verwendet werden, um eine Behauptung über eine Grundgesamtheit zu bestätigen (verifizieren) oder zu widerlegen (falsifizieren)
Regression
Vorhersage über eine Variable aufgrund anderer Variable
Mittelwert
das arithmetische Mittel, µ
Median
der Wert, der de facto in der Mitte liegt
Standardabweichung
Maß der Schwankung; Streubreite, σ