Deskriptive Statistik Flashcards
Unterscheidung in der Datenerhebung:
ausgewählte Versuchseinheiten und Stufen der Einflussgrößen sind?
welche Versuchseinheiten gibt es noch?
- aktiv appliziert (z.B. Sorten, Düngestufen)
- passiv appliziert (z.B. Bodengegebenheiten, Witterung)
- nicht appliziert (z.B. 10 Partienten mit Diabetes, 10 ohne)
- zufällige Versuchseinheiten (z.B. 20 Patienten, Zahl der Diabetiker zufällig)
Variablentypen (Unterteilung)
- Qualitativ:
1. Nominal (Ordnung nicht möglich, z.B. rot/grün/gelb
2. Ordinal (Ordnung möglich, Abstände nicht interpretierbar, z.B. jung/mittel/alt)
3. Dichotom (2 Versuchsausgänge, z.B. gesund/krank) - Quantitativ:
1. Diskret
– 1.1. beschränkt (endlich viele unterschiedliche Ausprägungen, z.B. Anzahl von gesamt)
–1.2. unbeschränkt (unendlich viele unterschiedliche Ausprägungen, z.B. Anzahlen)
2. stetig
–2.1. intervallskaliert (Quotienten nicht eindeutig interpretierbar, z.B. °C)
–2.2. verhältnisskaliert (Quotienten eindeutig interpretierbar, z.B. K, m, kg)
Wann ist die Umwandlung von quantitativen Variablentypen in Qualitative sinnvoll? Was geht dabei mit einher?
sinnvoll, wenn Wertebereiche eher von Interesse sind als einzelne Werte
–> i.d.R. mit Informationsverlust verbunden)
Wann ist die Umwandlung von qualitativen Variablentypen in Quantitative sinnvoll? Was geht dabei mit einher?
sinnvoll bei Äquidistanz (Abstandsskalierung) der Werte (z.B. Schulnoten)
–> i.d.R. mit Informationsverzerrung verbunden
Was ist die Varianz
Streuung, mittlere quadratische Abweichung vom Mittelwert
Was ist die Standardabweichung
mittlere Abweichung vom Mittelwert
Was ist der Median
mittlerer Wert der geordneten Stichprobe (über und unter dem Wert 50% der Daten)
Was sind die p-Quantile
Wert unter dem sich p x 100% der Daten befinden; x0.25 = erstes Quantil, x0.75 = drittes Quartil
Was ist der IQR
Interquartilsabstand
Maß der Streuung
Welche Visualisierungsmöglichkeiten der Daten mittels geeigneter Grafiken gibt es?
Histogramm
Balken-/Säulendiagramm
Kreisdiagramm
Boxplot
Zeitkurven
Streudiagramm
Mosaikplot
Was erklärt der Standardfehler
Er erklärt den Fehler (+ / -) um den Mittelwert, um es auf die Gesamtmaßeinheit zu beziehen, welche wir nicht kennen (10 Leute –> Gesamtpopulation)
Was ist der Variationskoeffizient
Die relative Standardabweichung
–> egal welche Einheit wir bei den Fallzahlen verwenden, wir bekommen eine unterschiedliche Standardabweichung raus, aber den gleichen VK (weil relativ)
Box beim Boxplot
- Länge
- ?% der Daten
Länge: IQR
beinhaltet 50% der Daten
Whisker
von wo bis wo
max. Länge?
- Minimum –> 0.25 Quartil, - 0.75 Quartil –> Maximum
- max. Länge: 1.5 x IQR
Wie berechnet man Ausreißer?
x < x0.25 − 1.5×IQR (unterer A.)
x > x0.75 + 1.5×IQR (oberer A.)