Deskriptive Statistik Flashcards

1
Q

Unterscheidung in der Datenerhebung:
ausgewählte Versuchseinheiten und Stufen der Einflussgrößen sind?
welche Versuchseinheiten gibt es noch?

A
  • aktiv appliziert (z.B. Sorten, Düngestufen)
  • passiv appliziert (z.B. Bodengegebenheiten, Witterung)
  • nicht appliziert (z.B. 10 Partienten mit Diabetes, 10 ohne)
  • zufällige Versuchseinheiten (z.B. 20 Patienten, Zahl der Diabetiker zufällig)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Variablentypen (Unterteilung)

A
  • Qualitativ:
    1. Nominal (Ordnung nicht möglich, z.B. rot/grün/gelb
    2. Ordinal (Ordnung möglich, Abstände nicht interpretierbar, z.B. jung/mittel/alt)
    3. Dichotom (2 Versuchsausgänge, z.B. gesund/krank)
  • Quantitativ:
    1. Diskret
    – 1.1. beschränkt (endlich viele unterschiedliche Ausprägungen, z.B. Anzahl von gesamt)
    –1.2. unbeschränkt (unendlich viele unterschiedliche Ausprägungen, z.B. Anzahlen)
    2. stetig
    –2.1. intervallskaliert (Quotienten nicht eindeutig interpretierbar, z.B. °C)
    –2.2. verhältnisskaliert (Quotienten eindeutig interpretierbar, z.B. K, m, kg)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wann ist die Umwandlung von quantitativen Variablentypen in Qualitative sinnvoll? Was geht dabei mit einher?

A

sinnvoll, wenn Wertebereiche eher von Interesse sind als einzelne Werte
–> i.d.R. mit Informationsverlust verbunden)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wann ist die Umwandlung von qualitativen Variablentypen in Quantitative sinnvoll? Was geht dabei mit einher?

A

sinnvoll bei Äquidistanz (Abstandsskalierung) der Werte (z.B. Schulnoten)
–> i.d.R. mit Informationsverzerrung verbunden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist die Varianz

A

Streuung, mittlere quadratische Abweichung vom Mittelwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist die Standardabweichung

A

mittlere Abweichung vom Mittelwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist der Median

A

mittlerer Wert der geordneten Stichprobe (über und unter dem Wert 50% der Daten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind die p-Quantile

A

Wert unter dem sich p x 100% der Daten befinden; x0.25 = erstes Quantil, x0.75 = drittes Quartil

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist der IQR

A

Interquartilsabstand
Maß der Streuung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welche Visualisierungsmöglichkeiten der Daten mittels geeigneter Grafiken gibt es?

A

Histogramm
Balken-/Säulendiagramm
Kreisdiagramm
Boxplot
Zeitkurven
Streudiagramm
Mosaikplot

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was erklärt der Standardfehler

A

Er erklärt den Fehler (+ / -) um den Mittelwert, um es auf die Gesamtmaßeinheit zu beziehen, welche wir nicht kennen (10 Leute –> Gesamtpopulation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Variationskoeffizient

A

Die relative Standardabweichung
–> egal welche Einheit wir bei den Fallzahlen verwenden, wir bekommen eine unterschiedliche Standardabweichung raus, aber den gleichen VK (weil relativ)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Box beim Boxplot
- Länge
- ?% der Daten

A

Länge: IQR
beinhaltet 50% der Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Whisker
von wo bis wo
max. Länge?

A
  • Minimum –> 0.25 Quartil, - 0.75 Quartil –> Maximum
  • max. Länge: 1.5 x IQR
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie berechnet man Ausreißer?

A

x < x0.25 − 1.5×IQR (unterer A.)
x > x0.75 + 1.5×IQR (oberer A.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Boxplotanalyse (Schritte)

A
  1. Trend erkennbar? (zwischen verschiedenen, nur wenn klarer Anstieg, Abfall)
  2. Verteilung der Daten und Symmetrie
    wenige Ausreißer, gleich lange Whisker (und nicht so lang, meisten Werte um Mittelwert/Median herum) und symmetrische Box, spricht für Normalverteilung (Gegenteil dagegen)
  3. Varianzhomogen/-heterogen
    Länge der Whisker und Länge der Boxen
    bei einem: Position des Medians in Box
  4. Ausreißer berechnen
    x < x0.25 − 1.5×IQR (unterer A.)
    x > x0.75 + 1.5×IQR (oberer A.)
  5. Fallzahl bekannt?
    wird angegeben mit n
17
Q

Unterschiedliche Verteilungen mit Unterkategorien

A

diskrete Verteilung:
- Gleichverteilung (Würfeln –> Gleiche zu erwartendes Ergebnis)
- Binomialverteilung (Anzahl toter/lebendiger Insekten)
- Multinomialverteilung (Vererbung mit mehr als 2 Vererbungstypen)
- Poissonverteilung (Anzahl Blätter pro Pflanze)

stetige Verteilung:
- Gleichverteilung (zufälliger Zeitpunkt in Zeitintervall)
- Normalverteilung (Trockenmasse in g)
Exponentialverteilung (Wartezeit bis Bestäubung in min)

18
Q

Was heißt diskret, was stetig verteilt?

A
  • diskret:
    nur endlich oder abzählbar viele Werte möglich mit zugehörigen Einzelwahrscheinlichkeit
  • stetig: unendlich viele Werte möglich und eine Dichtefunktion existiert
19
Q

Was ist der Erwartungswert? E(X)

A
  • Wert, um den herum sich die Verteilung befindet bzw. streut
    1. Moment, Lageparameter, Schwerpunkt
20
Q

Was ist die Varianz? (Var(X)

A

mittlere quadratische Abweichung vom Erwartungswert, Streuung Var(X) = E ((X - E(X))quadriert)
2. Moment, Schwankungsparameter