Heft 1 Flashcards

1
Q

Statistische Einheit

A

Statistische Einheiten sind die zu untersuchenden Einheiten, auf die sich eine statistische Auswertung bezieht. So sind sie oft z.B.: Personen, Organisationen oder auch Messzeitpunkte. → Merkmalsträger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Variablen

A

**Variablen ** sind Merkmale, der statistischen Einheiten. Variable haben Ausprägungen (Werte, Beobachtungen). Z.B.: Die Variable Geschlecht hat die Ausprägung weiblich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Datenmatrix

A

Die **Datenmatrix ** ist die zusammenfassende, tabellarische Darstellung der Werte der Variablen von statistischen Einheiten in einer empirischen Untersuchung. (Variablen in den Spalten und statistische Einheiten in den Zeilen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Population

A

Als **Population ** bezeichnet man die Gesamtheit (Grundgesamtheit) der statistischen Einheiten, die in einer empirischen Studie betrachtet wird. In der Regel wird eine Stichprobe der Population untersucht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Stichprobe

Fromen von Stichproben

A

Eine **Stichprobe ** ist die Erfassung einer Teilmenge einer Population für eine statistische Untersuchung, wenn bspw. die Population für eine Vollerhebung zu groß ist. Sie sollte hinsichtlich der Merkmale, die für die Gesamtheit der Population von Bedeutung sind, repräsentativ sein.

Eine einfache Zufallsstichprobe liegt vor, wenn alle statistischen Einheiten einer Population die gleiche Wahrscheinlichkeit habe, in die Stichprobe aufgenommen zu werden.

Eine geschichtete Zufallsstichprobe liegt vor, wenn innerhalb der Population Teilpopulationen gebildet werden, aus denen dann Zufallsstichproben gezogen werden (z.B.: Erfassung der Schüler in einzelnen Bundesländern zum Vergleich dieser)

Eine Quotenstichprobe (Marktforschung) wird angewandt, wenn es notwendig ist, das die Ergebnisse repräsentativ für verschiedene Merkmale der Population sind. Für diese Merkmale werden dann prozentuale Anteile der Population ermittelt, welche dann als Quote für die Stichprobe gelten (z.B.: Quoten für Alter, Geschlecht, Einkommen, Familienstand der Bevölkerung)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Deskriptive Statistik

Interferenzstatistik

A

Bei der **deskriptiven Statistik ** geht es um die zusammenfassende Beschreibung von Variablen anhand von Grafiken, Tabellen, etc.

Die **Interferenzstatistik ** beschäftigt sich mit der Schätzung von Parametern und der Hypothesentestung von empirischen Studien, anhand der Ergebnisse der deskriptiven Statistik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Skala

A

Wertebereich einer Variablen

z.B.: Messung von Größe anhand der Meterskala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Ratioskala

Ratioskalenniveau/Verhältnisskalenniveau

A

Höchster Informationsgehalt (metrisch)

Hier ist die Messung dadurch gekennzeichnet, dass ein natürlicher Nullpunkt und eine definierte Messeinheit vorliegen (Meter, Volumen, etc.)

Man kann den Messwert x auf der Skala durch multiplikation mit (b>0) in eine andere, jedoch äquivalente Messeinheit transformieren (bspw.: Meter in Zentimeter mit b=100)

f(x)= x*b

Die Werte der Skala lassen sich der größe nach ordnen.

Es lassen sich sinnvoll Differenzen bilden.

Es lassen sich sinnvoll Quotienten bilden.

Bild: Gummiband mit Skalierung. An einem Ende am Nullpunkt befestigt

QUOTIENTEN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Intervallskala

Intervallskalenniveau

A

Im Prinzip eine Ratioskala, mit dem Unterschied, dass sich hier der Nullpunkt beliebig festlegen lässt (z.B.: Temperaturmessung → °F, °C → 0°C = 32°F) (metrisch)

Hierbei ist die Interpretation von Abständen zum Nullpunkt nicht sinnvoll. Die von Äbständen zwischen den Ausprägungen schon(z.B.: 20°C ist doppelt so hoch, wie 10°C; jedoch ist das Äquivalent von 68°F nicht doppelt so hoch wie das andere Äquivalent 50°F)

Die Werte lassen sich der Größe nach ordnen.

Es lassen sich sinnvoll Differenzen bilden.

Es lassen sich nicht sinnvoll quotienten bilden.

Bild: Gummiband mit Skalierung. An beliebigem Punkt befestigt

DIFFERENZEN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Ordinalskala

Ordinalskalenniveau

A

Keine sinnvollen Abstände zwischen Ausprägungen definiert. Somit werden den Merkmalsausprägungen häufig Ränge zugeordnet (z.B.: Rangfolge der Fertigstellung einer Aufgabe)

Kein absoluter Nullpunkt.

Werte lassen sich der Größe nach ordnen

Es lassen sich keine Differenzen oder Quotienten bilden

Bild: Perlenkette: Reihenfolge, aber kein Abstand deffiniert.

ORDNEN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Nominalskala

Nominalskalenniveau

A

Skala mit niedrigem Informationsgehalt (z.B.: Geschlecht mit Ausprägungen: Männlich/weiblich, Familienstand mit Auspr.: Ledig, verheiratet, geschieden, verwitwet)

Wichtig ist, dass den versch. Ausprägungen jeweils eindeutig versch. Zahlen, Buchstaben, etc. zugewiesen werden.

Kein absoluter Nullpunkt.

Kann nicht der Größe nach geordnet werden/nicht sinnvoll in in Reihenfolge

Es lassen sich keine Differenzen oder Quotienten bilden

Bild: Menge unterschiedlicher Symbole

AUSZÄHLEN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie verhalten sich die Skalen zueinander?

A

Eine Ratioskala ist eine Intervallskala ist eine Ordinalskala ist eine Nominalskala

Eine Intervallskala ist eine Ordinalskala ist eine Nominalskala

Eine Ordinalskala ist eine Nominalskala

Ratioskala und Intervallskala werden auch metrische Skalen genannt

Metrische Skalen und Ordinalskala sind quantitative Skalen

Nominalskala ist eine qualitative Skala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qualitative und Quantitative Variablen

A

Quantitative Variablen habe Ausprägungen, die die Intensität des Merkmals unterscheiden lassen. Mindestens ordinalskaliert. (z.B.: IQ-Test, Schulnotenvergleich)

Qualitative Variablen haben Ausprägungen, die verschiedene Eigenschaften der Variablen Charakterisieren, jedoch keine Aussage über ihre Intensität treffen können. Nominalskalen sind IMMER qualitativ. (z.B.: Geschlecht → Männlich, Weiblich; Nasenform → krumm, gerade)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Diskrete Variablen

Stetige Variablen

A

Die Menge der Ausprägungen zwischen diskreten Variablenist innerhalb der natürlichen, endlichen Zahlen n, oder der Menge der unendlichen, natürlichen Zahlen n repräsentiert.(z.B.: die Schulnoten 1 bis 6)

Die Menge der Ausprägungen zwischen stetigen Variablenist nicht abzählbar. Zwischen ihnen können unendliche viele Werte liegen (Menge der reellen Zahlen).(z.B.: Größe, Gewicht)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Häufigkeitsverteilung

Formen derselben

A

Die Häufigkeitsverteilung erlaubt einen Überblick über die Verteilung von Variablen und ihren Ausprägungen auf den vorhandenen Wertebereich.

Die absolute Häufigkeitsverteilung einer Ausprägung beschreibt die tatsächliche Anzahl von statistischen Einheiten mit dieser Ausprägung innerhalb der Stichprobe.

Die relative Häufigkeit setzt den Anteil der absoluten Häufigkeit einer Ausprägung in relation zur Gesamtstichprobe. (Absolute Häufigkeit geteilt durch Gesamtumfang multipliziert mit 100%)

Die Berechnung der kumulierten Häufigkeit einer Ausprägung kann nur erfolgen, wenn alle Ausprägungen in Reihenfolge gebracht werden können. Sie beschreibt die Summe der relativen Häufigkeiten, die im Vergleich zu dieser Ausprägung keiner oder gleich groß sind. (z.B.: Anteil der Schulnoten 2 und besser, 3 und besser, etc)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Empirische Verteilungsfunktion und ihre Darstellung

A

Die Verteilung der kumulierten, relativen Häufigkeiten wird auch empirische Verteilungsfunktion genannt.

Sie wird häufig durch eine sogenannte Sprung-, oder Treppenfunktion dargestellt, da hier (im Gegensatz zu anderen Verteilungsformen) kein Werteverlust entsteht und die gesamte Häufigkeitstabelle rekonstruieren lässt. So ist eine exakte Darstellung der Messwerte möglich.

Der Sprung gibt hierbei den Wechsel in die nächste kumulierte Häufigkeit an (z.B.: von 0.05 für IQ 85-86 auf 0.15 für IQ 87)

17
Q

Kreis- und Balkendiagramm

A

**Kreis- und Balkendiagramme ** bieten sich an, wenn diskrete Variablen mit wenigen Ausprägungen dargestellt werden sollen (z.B.: Häufigkeiten von Schulnoten oder Modellen einer Automarke)

**Kreisdiagramme ** eignen sich jedoch nur für Verteilungen mit einer geringen Anzahl von Ausprägungen (ca. r kleiner gleich 6)

Balkendiagramme sind auch besser zu differenzieren als Kreisflächenanteile.

18
Q

Stamm-Blatt-Diagramm

A

Das Stamm-Blatt-Diagramm eignet sich für metrische Variablen mit nicht zu vielen Ausprägungen (z.B.: Ergebnisse eines IQ-Tests mit 10 Ausprägungen). Es stellt die Form der Häufigkeitsverteilnug dar, lässt aber gleichzeitig die einzelnen Beobachtungen differenzierbar.

Die Ausprägungen werden der Größe nach geordnet und werden dann als Stamm und Blatt dargestellt, wobei der Stamm (links eines senkrechten Strichs) alle bis auf die letzte Ziffer enthält und das Blatt (rechts des Strichs) die letzte Ziffer (bei 127 → 12 Stamm und 7 Blatt). Der Stamm hat hierbei z.B. den Faktor 10 und das Blatt den Faktor 1.

19
Q

Histogramm

A

Histogramme dienen der Darstellung von absoluten und relativen Häufigk. von metrischen Variablen mit besonders vielen Ausprägungen. Ihre Form verläuft analog zu der eines Balkendiagramms, jedoch ohne Zwischenräume.

Verlauf über einen bestimmten abhängigen Wertebereich (z.B.: Intervall des IQ von 50 bis 150)

Variablenwerte werden in Gruppen zusammengefasst, sodass die Häufigkeiten einer Klasse durch eine Säule repräsentiert wird. (Werteverlust, Klassenbreite beachten wegen Interpretation)

Vermittelt guten Eindruck von Lage(zentraler Wert), Breite (50-150) und Form(symmetrisch) einer Häufigkeitsverteilung.

20
Q

Normalverteilung

A

Bei hinreichender Anzahl von Werten einer metrischen Variablen stellen sich die Häufigkeitsverteilungen von Merkmalen wie Größe, Gewichtoder Intelligenz als Normalverteilungen in Form einer **Gauß´schen Glockenkurve ** dar → “ist normalverteilt”

21
Q

Uni-, bi- und multimodale Verteilung

A

Die Anzahl der “Gipfel” ist ein wichtiges Kriterium zur Beurteilung der Arten von Häufigkeitsverteilungen. Je nach Anzahl der Gipfel spricht man von uni-, bi- oder multimodalen Verteilungen.

22
Q

Rechts- und linksschiefe Verteilung

A

Bei einer rechtsschiefen(linkssteilen) Verteilung liegt keine Symmetrie vor, sondern sie fällt zur rechten Seite flach ab/steigt zur linken Seite steil an (z.B.: gemessene Reaktionszeit)

Eine linksschiefe(rechtssteile) Verteilung fällt zur linken Seite flach ab/steigt zur rechten Seite steil an (z.B.: Menge gelöster Aufgaben in leichtem Test)

23
Q

Verschiedene Mittelwerte

A

Das arithmetische Mittel(Mittelwert) dient der Beschreibung der zentralen Tendenz von metrischen Variablen(Def.: Summe der Ausprägungen einer Variablen geteilt durch die Anzahl der Ausprägungen)

Der Median ist die zentrale Tendenz von mindestens ordinalskalierten Variablen, wobei min 50% der geordneten Werte oberhalb und min 50% unterhalb desselben liegen.

Vom Modus/Modalwert spricht man, wenn man die zentrale Tendenz einer mind. nominalskalierten Variable beschreiben möchte. Er repräsentiert einen Wert einer Variablen mit der größten Häufigkeit. (nicht immer eindeutig)

24
Q

Quantile

A

Quantile dienen dazu, den Datensatz in bestimmte Größenverhältnisse aufzuteilen. Dabei wird eine Verteilung von geordneten Beobachtungen durch das **p-Quantil (0

so in zwei Teile geteilt**
, dass mind p*100% Beobachtungen kleiner gleich dem p-Quantil und (1-p)*100% Beobachtungen größer/gleich diesem sind. Somit entspräche das p.50-Quantil dem Mittelwert.

Hierauf aufbauend sind die sog. **Quartile ** die Quantile p.25, p.50 und p.75, welche den Datensatz vierteln.

25
Q

Interquartilabstand

A

Der Interquartilabstand ist ein Maß für die Streuung einer mind ordinalskalierten Variablen und wird als die **Differenz zwischen oberer und unterer Quartile berechnet. **

dQ = y.75 - y.25

26
Q

5-Punkte-Zusammenfassung

A

Die **5-Punkte-Zusammenfassung ** beschreibt eine Verteilung anhand der folgenden 5 Werte.

ymin y.25 ymed y.75 ymax

27
Q

Varianz

A

Die **Varianz (s2) ** dient dazu, die Streuung der Messwerte einer metrischen Variablen um den MW durch folgende Berechnung zu bestimmen:

Summe der quadrierten Abweichungen der Werte vom Mittelwert geteilt durch die Anzahl der Werte minus 1

s2 = 1/(n-1) * Σ SS

28
Q

Standardabweichung

A

Die **Standardabweichung (s) ** ist die Quadratwurzel aus der Varianz und verfügt im Gegensatz zu ihr um die gleiche Einheit, wie die Ausprägungen/Variable (z.B.: cm statt cm2)

29
Q

Wölbung

A

Die Kurtosis beschreibt die Wölbung einer Verteilung.

  1. Hat eine Variablen die identische Varianz einer Normalverteilung, jedoch eine abweichende Kurtosis, so spricht man von leptokurtisch, positiver Kurtosis, wenn relativ mehr Beobachtungen gleichzeitig im Zentrum und an den Rändern liegen und von platykurtisch, positiver Kurtosis, wenn relativ mehr Beobachtungen auf den “Schultern” liegen.
  2. Hat die Variable annähernd Normalverteilung, spricht man von einer mesokurtischen Kurtosis.
30
Q

ÿ

ymed

ymod

sy2

sy

yp

SS

A

Mittelwert von y

Median von y

Modus von y

Varianz von y

Standardabweichung von y

p-Quantil von y

Summe der Abweichungsquadrate