Univariate Deskriptivstatistik (nominal und ordinal) Flashcards

Sitzungen 1-3

1
Q

Was ist Statistik?

A

Methoden zum Beschreiben und Interpretieren von Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist beschreibenden (deskriptiven) Statistik?

A
  • Beschreiben & graph Aufbereitung von Daten

- Bsp. Häufigkeitsverteilung, Gruppenunterschiede bezüglich eines Merkmals

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Mit was beschäftigt sich die schliessende Statistik? (=Inferenzstatistik)

A
  • Allg. Schlussfolgerungen über Grundgesamtheiten (Populationen) unter Einbezug Wahrscheinlichkeitstheorie)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was für Daten werden in der Statistik ausgewertet?

A

numerische Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist eine Variabel?

A

veränderliche Grösse, Objekt unterscheiden sich

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind interindividuelle Unterschiede?

A

Unterscheide zw. ver. Individuen.

Bsp. Intelligenz, Extraversion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind intraindividuelle Veränderungen?

A

Unterschiede innerhalb der gleichen Person.

Bsp. Stimmung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist eine Intervenierende Variabel?

A
  • dazwischen gehend

- gleichzeitig Wirkung und Ursache

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist eine Moderatorvariabel?

A

Variablen, von deren Ausprägung der Zusammenhang zweier anderer Variablen abhängt (von lat. moderator = Lenker)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was sind diskrete Variablen?

A

endlich viele Ausprägungen oder abzählbar unendlich viele Ausprägungen (z.B. „Versuche bis zum richtigen Lösen einer Aufgabe“)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind stetige Variablen?

A

überabzählbar viele Ausprägungen innerhalb eines Intervalls (z.B. Gewicht,)
– Stetige Variablen sind immer quantitative/metrische Variablen (s.u. Messtheorie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was sind qualitative Variabeln?

A

durch Qualität und nicht durch Ausmass gekennzeichnet

– endliche Anzahl von Ausprägungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind quantitative Variabeln?

A

im Sinne einer Intensität oder eines Ausmasses interpretierbar
– Ausprägungen daher immer Zahlen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was kann die univariate statistische Methode?

A

Beschreibung eines Merkmals

Häufigkeit einer Krankheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was kann die bivariate statistische Methode?

A

Zusammenhang von zwei Merkmalen beschreiben (Anstrengung und Leistung)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was kann die multivariate statistische Methode?

A

Zusammenhang mehrerer Merkmale beschreiben (Schulden, Vermögen, Finanzielle Zufriedenheit)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was sind Skalenwerte?

A

Das was man gemessen hat, kann man einem Skalenweert zuordnen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was gilt es bei der Zuordung von Messdaten zu Skalenwerten zu beachten?

A

Empirische Relationen zwischen den Messobjekten müssen durch numerische Relationen der Skalenwerte repräsentiert werden (=relationelles System)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was ist ein Skalenniveau?

A

Das Skalenniveau definiert die Art und Weise, in der Unterschiede zwischen Messwerten interpretiert werden können.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

In welchen Skalenniveaus gibt es kardinalskalierte, metrische Daten?

A

Intervall, Verhältnis, Absolut

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

In welchem Skalenniveau werden folgende Daten ausgewertet: Geschlecht, Lieblingsfarbe

A

Nominal: Gleich- oder Verschiedenheit

- weder Ordnung noch quantitative Bedeutung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was macht man mit einer Urliste?

A

Häufigkeit von Merkmalsträger kann zusammengefasst

werden.
- Man kann daraus iene primäre Häufigkeitsverteilung machen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was ist die zentrale Tendenz?

A
  • zentralen Tendenz kennzeichnen das Zentrum einer Verteilung
  • ist eine Angabe über die Verteilung
  • Ist ein Lagemass
    Bsp. durchschnittlicher Messwert, mittlerer Messwert
24
Q

Was ist die zentrale Tendenz bei einer Nominalskala?

A

Das ist der Modus, die Merkmalsausprägung, die am häufigsten vorkommt

25
Q

Wann kann de Modus nicht eindeutig bestimmt werden bei Nominalskalen?

A

Wenn mehrere Kategorien gleichhäufig besetzt sind

26
Q

Wie kann eine Verteilung beschrieben werden?

A
  • mit Lagemassen (zentrale Tendenz)

- mit Streuungsmassen (Dispersion)

27
Q

Was sind singuläre Daten?

A

Bei singulären Daten kommt jeder beobachtete Wert (prinzipiell) nur
einmal vor

28
Q

Was haben wir für Daten bei einer Ordinalskala, Bsp. Satisfaction-with-Life Scale? (/ vorgegebene Kategorien, möglichst gleichabständig)

A

Wir haben kategoriale Daten mit geordneten Kategorien

29
Q

What isch der Median?

A
  • Kennwert der zentralen Tendenz (ein Lagemass)
  • Zentralwert
  • Wert genau in der Mitte
  • dort wo kumulierte Häufigkeit von 0,5 überschritten wird
30
Q

Warum ist bei singulären Daten (ohne Bindung) die eindeutige Bestimmung des Modus nicht möglich?

A

Weil z.B Rangplätze, alle gleichhäufig

31
Q

Ist es sinnvoll die Streuung bei singulär ordinalskalierten Daten zu berechnen?

A

Nicht wirklich, weil jeder Wert ist ja nur einmal vorhanden

32
Q

Was ist der rel. Info.gehalt H?

A

Zeigt Streuung von 0-1

33
Q

Was sind sekundäre Häufigkeitsverteilungen?

A

Ausgehend von der primären Häufigkeits- verteilung werden Kategorien gebildet und unter diesen werden die Messwerte zusammengefasst
> Kategorienbildung mehr oder weniger willkürlich (meistens 10-20 Kategorien)

34
Q

Wie kann man sekundäre Häufigkitsverteilungen graphische darstellen?

A

In einem Histogramm oder in einem Polygonzug

35
Q

Wann macht ein Polygonzug sinn?

A

Wenn man eine kontinuierliche Variabel darstellen will, wie z.B Reaktionszeit

36
Q

Ein anderes Wort für rechtsschief:

A

linkssteil, inksgipflig

37
Q

Wie ist die Verteilung, wenn es viele Werte um den Modalwert hat?

A

breitgipflig

38
Q

Was heisst unimodal, bimodal, multimodal?

A

Je nach Gipfelanzahl

39
Q

J, L, U, Umgekehrt-U sind Verteilungsformen, die nicht auf einem Haufen basieren, stimmt das?

A

yap

40
Q

Was ist die Spitze des Polygonzugs?

A

Der Modus=häufigst Besetzte Kategorie

41
Q

Was hat der Median für eine tolle Eigenschaft?

A

Die Summe der Abweichungsbeträge aller Messwerte vom Median ist kleiner als die Summe der Abweichungsbeträge von irgendeinem
anderen Wert

42
Q

Was ist das arithmetische Mittel?

A

Das arithmetische Mittel ist gleich der Summe aller beobachteten Merkmalswerte dividiert durch die Anzahl der Beobachtungen
- Das arithmetische Mittel repräsentiert die Lage einer Verteilung nach dem Kriterium der kleinsten Quadrate.

43
Q

Was hat das aritmetische Mittel für eine Eigenschaft?

A
  • Die Summe der Abweichungen aller Messwerte vom Mittelwert beträgt stets 0:
  • Die Summe der quadrierten Abweichungen der Messwerte vom Mittelwert ist stets kleiner als die Summe der quadrierten Abweichungen von irgendeinem anderen Wert:
44
Q

Was ist der Median?

A

Der Median repräsentiert die Lage einer Verteilung nach dem Kriterium der kleinsten Absolutabweichung.

45
Q

Wann ist das arithmetische Mitttel besonders aussagekräftig?

A

Bei symmetrischen unimodalen Verteilungen

- sensitiv auf Ausreisser

46
Q

Welcher Wert schätzt die Lage eienr Verteilung am besten, wenn es extreme Ausreisser hat?

A

Median

47
Q

Für was ist das GAM gut?

A

Mittelwerte aus mehreren Messwertreihen mitteln, die aus einer unterschiedlichen Anzahl von Objekten (“) bestehen

48
Q

Warum gibt es das getrimmte und das winsorische Mittel?

A

Weil Mittelwert (aaritmetisches Mittel) sensitiv auf Ausreisser reagiert, kann man die abschneiden oder auf einen Wert festfrieren

49
Q

Was versteht man unter robusten Lagemassen?

A
  • winsorisches Mittel

- getrimmtes Mittel

50
Q

Sind Quantile ein Lagemass oder ein Streuungsmass?

A

Lagemass und Basis für Dispersionsmasse (Streuungsmasse)

51
Q

Was ist die emp. Varianz?

A

Die empirische Varianz auch Stichprobenvarianz (lateinisch: „Verschiedenheit“) genannt, ist eine statistische Angabe für die Streubreite von Werten einer Stichprobe und in der deskriptiven Statistik eine Kennzahl einer Stichprobe. Sie gehört zu den Streuungsmaßen und beschreibt die mittlere quadratische Abweichung der einzelnen Messwerte vom empirischen Mittelwert. Sie stellt damit eine Art durchschnittliches Abweichungsquadrat dar.

52
Q

Was ist die emp. Standartabweichung?

A
  • Ist ein Mass dafür, wie weit die Werte um den Mittelwert streuen. (NICHT: durchschnittliche Abw. vom Mittelwert)
53
Q

reagieren Varianz und Standartabweichung sensibel auf Ausreisserwerte?

A

Ja, weil bei der Standartabweichung geht es ja darum wie weit die Werte vom Mittelwert entfernt liegen.
Und die Varianz errechnet sich ja dann aus der Standartabw.

54
Q

Für was braucht man die Stichprobenvarianz und Stichprobenstandardabweichung?

A

Werden zur Schätzung der Varianz und Standardabweichung in der Population herangezogen. Man will von der Stichprobe auf andere schliessen können-

55
Q

Wozu braucht es eine z-Transformation?

A

Man will die Werte in eine einheitliche Form bringen, besser zum Vergleichen. Auch zum Vergleich von Messwerten, die mit unterschiedlichen Messinstrumenten gewonnen wurden
Die Verteilung “-transformierter Werte hat einen Mittelwert von 0 und eine Standardabweichung von 1 (standardisierte Werte)

56
Q

Masse der zentralen Tendenz:

A

Modus, Median, Mittelwert (+ gewogenes, getrimmtes, winsorisiertes Mittel)

57
Q

Dispersionsmasse:

A

Streubereich, Variationsbreite, Quantile, !”#/%”#, Varianz,

Standardabweichung, relativer Informationsgehalt