statistik Flashcards

1
Q

Die statistischen Einheiten müssen

A

sachlich, räumlich und
zeitlich voneinander abgegrenzt werden und somit eindeutig
identifizierbar sein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Als Merkmal wird eine

A

Eigenschaft einer statistischen Einheit
bezeichnet, die in der statistischen Analyse betrachtet wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Die Werte oder Kategorien, die ein Merkmal annehmen kann,
werden als

A

Merkmalsausprägungen bezeichnet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Eine an einer bestimmten statistischen Einheit festgestellte
Merkmalsausprägung wird .

A

Merkmalswert oder Beobachtungswert genannt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Eine Nominalskala unterscheidet Merkmale nur nach

A

Gleichheit oder Verschiedenheit. Es existiert keine Rangordnung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Eine Ordinal- oder Rangskala liegt vor, wenn

A

die Merkmalswerte neben der qualitativen Unterschiedlichkeit eine natürliche
Rangordnung besitzen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Besitzt ein Merkmal die Eigenschaften eines ordinalen Merkmals
und ist zusätzlich noch die Interpretation der Abstände zweier verschiedener Merkmalsausprägungen möglich, so

A

kann das
Merkmal auf einer metrischen Skala (Kardinalskala) gemessen werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Ein Merkmal heißt diskret, wenn

A

es nur endlich viele oder höchstens diskrete
abzählbar unendlich viele Ausprägungen besitzt (nominal skalierte Merkmale
Merkmale; Merkmale, deren Wert durch Zählen bestimmt wird).
Nominal- und ordinalskalierte Merkmale sind stets diskret.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dagegen heißt ein metrisches Merkmal stetig (kontinuierlich), wenn

A

stetige
es überabzählbar viele Ausprägungen hat, d.h. wenigstens in einem Merkmale
bestimmten Bereich können unendlich viele Werte angenommen werden.
Z.B. wird das Merkmal Einkommen als stetiges Merkmal behandelt, da
es in Berechnungen mit vielen Nachkommastellen eingeht und somit
überabzählbar viele Ausprägungen vorliegen können. Die tatsächliche
Angabe erfolgt dagegen meistens nur mit zwei Nachkommastellen.
Ebenso kann das Merkmal Wohnfläche auf viele Nachkommastellen
gemessen werden, wobei oft nur ganze m2 angegeben werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Eine Skalentransformation kann als

A

Abbildung von einer
Menge Merkmalsausprägungen in eine anderere Menge Merkmalsäusprägungen angesehen werden. Dabei ist zu beachten,
dass die Ordnungseigenschaften der Skala erhalten bleiben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Je nach Skalenniveau sind verschiedene Transformationen zulässig, d.h.
durch die Transformation darf keine Information verloren gehen.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Bei einer eineindeutigen Skalentransformation, wird

A

jedem
Wert der alten Skala genau ein Wert der neuen Skala (und umgekehrt) zugeordnet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Eine monotone Skalentransformation liegt vor, wenn

A

die
Rangordnung der Skalenwerte erhalten bleibt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Lineare Skalentransformationen nutzen

A

lineare Funktionen
der Form y = a+bx, wobei das Verhältnis der Abstände zwischen
den Skalenwerten erhalten bleibt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Die Klassierung von Merkmalsausprägungen stellt eine

A

Zusammenfassung benachbarter Merkmalsausprägungen zu einer
Klasse dar, wobei die vorgegebene Ordnung erhalten bleibt. Dabei sollten disjunkte Klassen mit möglichst gleicher Breite (Ausnahme: Randklassen) ausgewählt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Für diskrete Merkmale gilt als Faustregel, dass bei Vorliegen von n Merkmalswerten die Anzahl der Klassen √
n betragen soll. Die Gesamtzahl der
Klassen sollte aufgrund der Übersichtlichkeit die Zahl 20 nicht überschreiten. Eine Klasse wird mittels der

A

Klassengrenzen, der Klassenbreite
und der Klassenmitte eindeutig festgelegt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Als offene Randklasse wird die

A

erste oder letzte der geordneten
Klassen bezeichnet, wenn keine untere bzw. obere Klassengrenze
vorhanden ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Liegt eine statistische Reihe vor, deren Beobachtungen aus nur einem
Merkmal bestehen, so wird eine eindimensionale (univariate) Häufigkeitsverteilung aufgestellt.
mehrdimensionale
Häufigkeitsvtlg.
Eine mehrdimensionale (multivariate) Häufigkeitsverteilung
ergibt sich, wenn

A

mehrere Merkmale gleichzeitig betrachtet werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Ein Stab- bzw. Säulendiagramm veranschaulicht

A

bei Vorliegen
einer horizontalen Achse eine höhenproportionale Darstellung der
Häufigkeiten mittels Stäben bzw. Säulen.
Balkendiagramme besitzen eine vertikale Achse mit waagerecht
aufgetragenen Balken (längenproportionale Darstellung).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

bei Vorliegen
einer horizontalen Achse eine höhenproportionale Darstellung der
Häufigkeiten mittels Stäben bzw. Säulen.
Balkendiagramme besitzen eine

A

vertikale Achse mit waagerecht
aufgetragenen Balken (längenproportionale Darstellung).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Ein Liniendiagramm/Kurvendiagramm ist eine

A

grafische Darstellung von Messzahlen oder Indexzahlen in einem Koordinatensystem durch Kurven bzw. geradlinig verbundene Punkte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Ein Histogramm ist eine

A

grafische Darstellung der Häufigkeiten eines klassierten, quantitativen Merkmals durch rechteckige Flächen
über den Klassen in einem Koordinatensystem. Es ist zu beachten,
dass die einzelnen Rechtecke des Histogramms unmittelbar aneinander schließen und nicht wie beim Säulendiagramm getrennt sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wird eine Nominalskala vorausgesetzt, bei der keine natürliche oder Nominalskala
vorgegebene Ordnung vorliegt, bieten sich

A

Flächendiagramme in Form
eines Kreisdiagramms an. Hierbei lässt sich am besten illustrieren, wie
die Gesamtzahl auf die einzelnen Ausprägungen aufgeteilt ist. Auch
Säulen-, Stab- und Balkendiagramme sind geeignete Darstellungsmöglichkeiten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Liegt eine Ordinalskala vor, wird in der Regel auf

A

Säulen-, Stab- und Ordinalskala
Balkendiagramme zurückgegriffen, wobei auch hier Flächendiagramme
sinnvoll verwendet werden können.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Die Summenhäufigkeit einer Merkmalsausprägung oder einer
oberen Klassengrenze eines wenigstens ordinal messbaren Merkmals ist

A

die zugeordnete Häufigkeit aller Beobachtungswerte, die
diese Merkmalsausprägung bzw. diese Klassengrenze nicht überschreiten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

summenhäufigkeit bsp

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Lagemaße (Mittelwerte) geben die

A

zentrale Tendenz einer Beobachtungsreihe mittels einer einzigen charakteristischen Größe
wieder, welche die beobachteten Merkmalswerte möglichst gut
repräsentieren soll.

27
Q

Der Modalwert xmod einer Häufigkeitsverteilung ist jene Merkmalsausprägung, die

A

am häufigsten vorkommt. Es gilt somit
h(xmod) = max
j
h(xj ) (Maximum über alle xj ).

28
Q

Der Median xmed zerlegt eine geordnete Reihe von Beobachtungswerten x(1), x(2), …, x(n)
in zwei gleiche Teile, so

A

dass
unterhalb und oberhalb des Medians gleich viele Beobachtungswerte liegen.
n ungerade: xmed = x(
n+1/
2
)

29
Q

Eine weitere wichtige Eigenschaft des Medians ist

A

seine Robustheit
gegenüber Ausreißern, d.h. der Median reagiert nicht auf Veränderungen
der Werte, die am Rande der Verteilung liegen.

30
Q

Der Median entspricht dem sogenannten 0.5-Quantil x0.5, dem Wert der

A

Beobachtungsreihe bis zu dem 50% der Beobachtungen liegen. Allgemein
wird als p-Quantil xp(0 < p < 1) der Wert xi der geordneten Reihe p-Quantil
x(1), …, x(n) bezeichnet bis zu dem p% der Beobachtungen liegen.

31
Q

Bei vielen ordinalskalierten Merkmalen
wie z.B. beim Rating von Fonds kann kein Durchschnittswert gebildet
werden. Weitere Quantile, die einen speziellen Namen tragen, sind die
Dezile 0.1-, 0.2-, … bzw. 0.9-Quantile x0.1, x0.2, …, x0.9, die auch als Dezile
bezeichnet werden, und zwar als 10%-Dezil, 20%-Dezil,…,90%-Dezil,
welche häufig mit 1.Dezil, 2.Dezil, …, 9.Dezil abgekürzt werden. Der
untere/obere Median entspricht somit

A

dem 50%-Dezil. Zu erwähnen sind weiter das
Quartil untere Quartil x0.25 und das obere Quartil x0.75.

32
Q

ungewogene
arithmetische
Mittel

33
Q

gewogene
geometrische
Mittel

34
Q

Die Spannweite w ist als

35
Q

Die empirische Varianz s˜
2
ist die

36
Q

Der Variationskoeffizient v ist eine relative Größe, welche

37
Q

Standardisierung
von Daten

38
Q

Kurtosis

39
Q

Die Häufigkeitstabelle zweier metrischer oder ordinalskalierter
Merkmale wird auch

A

Korrelationstabelle genannt.

40
Q

Die Verteilung nur eines Merkmals einer zweidimensionalen Häufigkeitsverteilung, wobei das andere Merkmal unberücksichtigt
bleibt, heißt

A

Randverteilung oder marginale Verteilung.

41
Q

Die Kovarianz Cov(X, Y ) der gemeinsamen Verteilung der
quantitativen Merkmale X und Y ist ein Maß für die

A

gemeinsame
Streuung der beiden Merkmale. Das Vorzeichen der Kovarianz
gibt die Richtung des vorliegenden Zusammenhangs an.

42
Q

Kontingenz bezeichnet den

A

Zusammenhang zwischen qualitativen Merkmalen und von Korrelation wird bei einem Zusammenhang zwischen quantitativen bzw. mindestens ordinalskalierten Merkmalen gesprochen.

43
Q

Zusammenhang zwischen qualitativen Merkmalen und von Korrelation wird bei einem

A

Zusammenhang zwischen quantitativen bzw. mindestens ordinalskalierten Merkmalen gesprochen.

44
Q

Formal nach Bravais

45
Q

Rangkorrelationseffizient

46
Q

Mit den tatsächlich beobachteten absoluten Häufigkeiten hjk und den sich bei Unabhängigkeit ergebenden absoluten Häufigkeiten wird die Hilfsgröße
χ
2
(Chi-Quadrat) berechnet.

47
Q

Kontingenzkoeffizient

48
Q

Kontingenzkoeffizient Beispiel

49
Q

Invarianzeigenschaft

A

Werden in einer Kontingenztabelle Zeilen bzw. Spalten miteinander vertauscht, so ändert sich der Kontingenzkoeffizient
nicht.

50
Q

Der Begriff Regression bezeichnet die Untersuchung der

A

Abhängigkeit der Veränderungen eines quantitativen Merkmals von
Änderungen eines anderen quantitativen Merkmals (=einfache
Regression) oder von Änderungen mehrerer quantitativer Merkmale (=mehrfache Regression).
Zur Beschreibung dieser Abhängigkeit wird die Regressionsfunktion verwendet.

51
Q

(Kriterium der KleinstenQuadrate)

A

Die Koeffizienten der Regressionsfunktion werden so bestimmt, dass die Summe der quadrierten Abweichungen
der Beobachtungswerte yi von den Regressionsfunktionswerten f(xi) ein Minimum wird

52
Q

Die Koeffizienten a und b heißen auch Regressionskoeffizienten:

53
Q

Die Koeffizienten a und b heißen auch Regressionskoeffizienten: Beispiel

54
Q

Punktschätzung:

A

Eine Punktschätzung entspricht der Angabe eines einzelnen Wertes für
den zu schätzenden Parameter.

55
Q

Intervallschätzung

A

Abweichungen eines Punktschätzers vom wahren Wert sind in der
Regel unvermeidlich. Daher wird eine Punktschätzung oft durch eine
Intervallschätzung ergänzt. Dabei wird ein Intervall bestimmt, das den
wahren, unbekannten Wert des Parameters mit einer vorgegebenen
Wahrscheinlichkeit überdeckt.

56
Q

Der sich für bestimmte Stichprobenwerte x1, x2, …, xn ergebende Wert
Schätzwert, der Schätzfunktion g(x1, …, xn) = t heißt

A

Schätzwert oder PunktPunktschätzung schätzung, d.h. ˆθ = t.

57
Q

Schätzfunktionen sind durch bestimmte Eigenschaften charakterisiert,
die Auskunft darüber geben, wie gut Schätzfunktionen für bestimmte
Zwecke geeignet sind. Behandelt werden an dieser Stelle drei wichtige
Eigenschaften, nämlich die

A

Erwartungstreue, die Effizienz und die
Konsistenz

58
Q

Eine Schätzfunktion T des Parameters θ heißt erwartungstreu oder unverzerrt (engl.: „unbiased“), wenn die

A

Beziehung
E(T) = θ gilt, d.h. der Erwartungswert der Zufallsvariablen T
entspricht dem wahren Wert des zu schätzenden Parameters

59
Q

Um eine erwartungstreue Schätzfunktion für die Varianz der Grundgesamtheit zu erhalten, wird die Stichprobenvarianz wie folgt definiert
(Beweis s. Aufgabe 1 zu Kapitel 1):

60
Q

Eine erwartungstreue Schätzfunktion T für den Parameter
θ einer Grundgesamtheit heißt effizient, wenn

A

T eine endliche
Varianz besitzt und wenn es für θ keine andere erwartungstreue
Schätzfunktion T
∗ gibt, welche eine kleinere Varianz als T besitzt. Es wird mit der Effizienz also die Forderung der Erwartungstreue und minimaler Varianz gestellt.

61
Q

Endlichkeitskorrektur

62
Q

Im Wesentlichen werden zwei Typen von Nullhypothesen unterschieden, und zwar zwischen

A

zweiseitigen Nullhypothesen (Punkthypothesen) und einseitigen Nullhypothesen
(Bereichshypothesen).

63
Q

Fehler 1. Art,
α-Fehler

A

Die Ablehnung einer zutreffenden Nullhypothese, obwohl sie richtig ist, wird als „Fehler 1. Art“ oder auch
„α-Fehler“ bezeichnet.
Die vorgegebene Wahrscheinlichkeit α heißt Irrtumswahrscheinlichkeit oder Signifikanzniveau.

64
Q

Fehler 2. Art,
β-Fehler

A

Die Wahrscheinlichkeit β, mit der die Nullhypothese nicht
abgelehnt wird, obwohl sie falsch ist, heißt Fehler 2.
Art oder β-Fehler.