Deskriptive Statistik Flashcards
Unterscheidung in der Datenerhebung:
ausgewählte Versuchseinheiten und Stufen der Einflussgrößen sind?
welche Versuchseinheiten gibt es noch?
- aktiv appliziert (z.B. Sorten, Düngestufen)
- passiv appliziert (z.B. Bodengegebenheiten, Witterung)
- nicht appliziert (z.B. 10 Partienten mit Diabetes, 10 ohne)
- zufällige Versuchseinheiten (z.B. 20 Patienten, Zahl der Diabetiker zufällig)
Variablentypen (Unterteilung)
- Qualitativ:
1. Nominal (Ordnung nicht möglich, z.B. rot/grün/gelb
2. Ordinal (Ordnung möglich, Abstände nicht interpretierbar, z.B. jung/mittel/alt)
3. Dichotom (2 Versuchsausgänge, z.B. gesund/krank) - Quantitativ:
1. Diskret
– 1.1. beschränkt (endlich viele unterschiedliche Ausprägungen, z.B. Anzahl von gesamt)
–1.2. unbeschränkt (unendlich viele unterschiedliche Ausprägungen, z.B. Anzahlen)
2. stetig
–2.1. intervallskaliert (Quotienten nicht eindeutig interpretierbar, z.B. °C)
–2.2. verhältnisskaliert (Quotienten eindeutig interpretierbar, z.B. K, m, kg)
Wann ist die Umwandlung von quantitativen Variablentypen in Qualitative sinnvoll? Was geht dabei mit einher?
sinnvoll, wenn Wertebereiche eher von Interesse sind als einzelne Werte
–> i.d.R. mit Informationsverlust verbunden)
Wann ist die Umwandlung von qualitativen Variablentypen in Quantitative sinnvoll? Was geht dabei mit einher?
sinnvoll bei Äquidistanz (Abstandsskalierung) der Werte (z.B. Schulnoten)
–> i.d.R. mit Informationsverzerrung verbunden
Was ist die Varianz
Streuung, mittlere quadratische Abweichung vom Mittelwert
Was ist die Standardabweichung
mittlere Abweichung vom Mittelwert
Was ist der Median
mittlerer Wert der geordneten Stichprobe (über und unter dem Wert 50% der Daten)
Was sind die p-Quantile
Wert unter dem sich p x 100% der Daten befinden; x0.25 = erstes Quantil, x0.75 = drittes Quartil
Was ist der IQR
Interquartilsabstand
Maß der Streuung
Welche Visualisierungsmöglichkeiten der Daten mittels geeigneter Grafiken gibt es?
Histogramm
Balken-/Säulendiagramm
Kreisdiagramm
Boxplot
Zeitkurven
Streudiagramm
Mosaikplot
Was erklärt der Standardfehler
Er erklärt den Fehler (+ / -) um den Mittelwert, um es auf die Gesamtmaßeinheit zu beziehen, welche wir nicht kennen (10 Leute –> Gesamtpopulation)
Was ist der Variationskoeffizient
Die relative Standardabweichung
–> egal welche Einheit wir bei den Fallzahlen verwenden, wir bekommen eine unterschiedliche Standardabweichung raus, aber den gleichen VK (weil relativ)
Box beim Boxplot
- Länge
- ?% der Daten
Länge: IQR
beinhaltet 50% der Daten
Whisker
von wo bis wo
max. Länge?
- Minimum –> 0.25 Quartil, - 0.75 Quartil –> Maximum
- max. Länge: 1.5 x IQR
Wie berechnet man Ausreißer?
x < x0.25 − 1.5×IQR (unterer A.)
x > x0.75 + 1.5×IQR (oberer A.)
Boxplotanalyse (Schritte)
- Trend erkennbar? (zwischen verschiedenen, nur wenn klarer Anstieg, Abfall)
- Verteilung der Daten und Symmetrie
wenige Ausreißer, gleich lange Whisker (und nicht so lang, meisten Werte um Mittelwert/Median herum) und symmetrische Box, spricht für Normalverteilung (Gegenteil dagegen) - Varianzhomogen/-heterogen
Länge der Whisker und Länge der Boxen
bei einem: Position des Medians in Box - Ausreißer berechnen
x < x0.25 − 1.5×IQR (unterer A.)
x > x0.75 + 1.5×IQR (oberer A.) - Fallzahl bekannt?
wird angegeben mit n
Unterschiedliche Verteilungen mit Unterkategorien
diskrete Verteilung:
- Gleichverteilung (Würfeln –> Gleiche zu erwartendes Ergebnis)
- Binomialverteilung (Anzahl toter/lebendiger Insekten)
- Multinomialverteilung (Vererbung mit mehr als 2 Vererbungstypen)
- Poissonverteilung (Anzahl Blätter pro Pflanze)
stetige Verteilung:
- Gleichverteilung (zufälliger Zeitpunkt in Zeitintervall)
- Normalverteilung (Trockenmasse in g)
Exponentialverteilung (Wartezeit bis Bestäubung in min)
Was heißt diskret, was stetig verteilt?
- diskret:
nur endlich oder abzählbar viele Werte möglich mit zugehörigen Einzelwahrscheinlichkeit - stetig: unendlich viele Werte möglich und eine Dichtefunktion existiert
Was ist der Erwartungswert? E(X)
- Wert, um den herum sich die Verteilung befindet bzw. streut
- Moment, Lageparameter, Schwerpunkt
Was ist die Varianz? (Var(X)
mittlere quadratische Abweichung vom Erwartungswert, Streuung Var(X) = E ((X - E(X))quadriert)
2. Moment, Schwankungsparameter