Statistik Flashcards

Univariate deskriptive, bivariate, multivariate, Stochastik, Grundlagen der Inferenzstatistik

1
Q

Was sind statistische Einheiten?

A

“Objekte”, deren Informationen erhoben werden bspw. Menschen, Gruppen etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind Beobachtungen?

A

Erhobene Informationen (Tests/Ergebnisse).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind Daten?

A

Alle Beobachtungen zusammengefasst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist eine Stichprobe?

A

Gesamtheit der beobachteten Einheiten oder ein Teil der Gesamtheit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist eine Population?

A

Gesamtheit aller Merkmalsträger; Stichprobe= Teilmenge einer Population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist die deskriptive Statistik?

A

Daten einer Stichprobe werden zusammengefasst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist die Inferenzstatistik?

A

Von Daten einer Stichprobe wird auf die Gesamtheit geschlossen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist ein Merkmal?

A

Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind Ausprägungen?

A

Werte, die eine Variable annehmen kann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist eine Konstante?

A

Eine immer gleich bleibende Zahl.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Worin unterscheiden qualitative und quantitative Variablen?

A

In der Intensität.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was sind qualitative Variablen?

A

Endlich viele, nicht geordnete Kategorien bspw. Geschlecht, Farbe, Beliebtheit, es gibt keine Rangfolge.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind quantitative Variablen?

A

Sie beschreiben das Ausmaß der Intensität eines Merkmals, bspw. Körpergröße, Bruttoverdienst, Körpergewicht, messbar und lassen sich vergleichen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Worin unterscheiden diskrete und stetige Variablen?

A

In der Anzahl.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind diskrete Variablen?

A

Endlich viele Verschiedene Ausprägungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind stetige Variablen?

A

Können alle Werte aus einem Intervall annehmen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was sind Skalenniveaus?

A

Beobachtbarem Verhalten werden Zahlen zugeordnet, so dass man sie auf einer Skala messen/vergleichen kann. Der Informationsgehalt hängt von der Messung ab und wird im Skalenniveau widergespiegelt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist das Nominalskalenniveau?

A

Zahlen werden Ausprägungen zugeordnet. Das Ziel ist die Unterscheidung, die Zahlen sind nicht interpretierbar. Bspw.: Geschlecht, Familienstand, Konstitutionstypen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was sind die zulässigen Transformationen auf Nominalskalenniveau?

A

Eineindeutigkeitsabbildungen: f(x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Was ist das Ordinalskalenniveau?

A

Ausprägungen werden geordnet. Zahlen spiegeln die Ausprägungen wieder, die Abstände sind allerdings nicht interpretierbar. Rechenoperatoren sind i.d.R nicht sinnvoll. Bspw.: Soziale Schicht, Maslowsche Bedürfnishierarchie, Rangreihe der Arbeitsleistung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was sind die zulässigen Transformationen auf Ordinalskalenniveau?

A

Streng monoton wachsende Abbildungen: f(x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was ist das Intervallskalenniveau?

A

Es gibt keinen natürlichen Nullpunkt, die Höhe der Ausprägungen ist nicht direkt interpretierbar. Allerdings sind die Abstände vergleichbar, ihr Verhältnis zueinander ist unter zulässigen Transformationen konstant. Bspw. Temperatur, IQ, Kalender.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was ist eine Messung “per fiat”?

A

Das Intervallskalenniveau wird in Untersuchungen oft “per fiat” angenommen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was sind zulässige Transformationen auf Intervallskalenniveau?

A

Positiv lineare Abbildungen: b+ax, d.h. Verhältnisse der Different bleiben erhalten, wenn b>0, um Ordnung beizubehalten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Was ist ein anderer Name für die Verhältnisskala?

A

Ratioskala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Was ist das Verhältnisskalenniveau?

A

Es definiert eine Einheit und besitzt einen natürlichen Nullpunkt (einziger Unterschied zur Intervallskala). Werte können direkt miteinander verglichen werden, bei Messungen psychischer Merkmale selten vorhanden. Bspw. Größe, Gewicht, Einkommen, Rektionszeit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Was sind zulässige Transformationen auf Verhältnisskalenniveau?

A

Ähnlichkeitsabbildungen der Form: bx mit b>0 d.h. Verhältnisse und Ordnung bleiben erhalten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Wie symbolisiert man den Stichprobenumfang?

A

n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Wie stellt man einzelne Beobachtungen dar?

A

y1,…yn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Was gibt die Häufigkeitsverteilung an?

A

Sie gibt an, wie oft eine Ausprägung in einer Stichprobe beobachtet wurde, sowohl absolute, relative als auch kumulierte Häufigkeiten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Was ist die absolute Häufigkeit?

A

Anzahl der statistischen Einheiten, bei denen ein Merkmal betrachte wurde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Was ist die relative Häufigkeit?

A

Anteil der statistischen Einheiten, welche das Merkmal aufweisen. Zahlen zwischen 0 und 1 oder %: Anzahl/Stichprobenumfang.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Was ist die kumulierte Häufigkeit?

A

Summe der Häufigkeiten aller Ausprägungen = a. Bspw. relative Häufigkeiten:1-2=.4, 2-3=.3, 4-5=.3 -> 1-2=.4; 2-3= .4+.3=.7; 4-5= .4+.3+.3=1.0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Was sind die Eigenschaften von Repräsentationsmessungen?

A

repräsentativ, Zahlen werden Objekten zugewiesen, Eigenschaften der Zahlen spiegeln Beziehungen zwischen den Objekten wider.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Was ist der psychometrische Ansatz?

A

Zusatz zur Repräsentationsmessung, aggregierte (Zusammengefasste) Daten werden mit externen Hilfsmitteln zur Bewertung der Güte der Messungen herangezogen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Was ist das Absolutskalenniveau?

A

Steht noch übe Verhältnisskala, natürliche Einheit, die nicht festlegbar ist, nicht mehr transformierbar, da keine andere Einheit vorhanden ist. Bspw. Anzahl von Personen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Was ist eine empirische Verteilungsfunktion?

A

Verteilung der kumulierten Häufigkeit. Sinnvolle Interpretation mindestens auf Ordinalskalenniveau. Punkt kennzeichnet Beobachtung selbst, Strich den Beginn der nächsten Beobachtung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Wann verwendet man ein Stammblattdiagramm?

A

quantitative Beobachtungen bei nicht zu vielen Beobachtungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Wie ordnet man die Zahlen im Stamm eines Stammblattdiagramms?

A

Aufsteigend von oben nach unten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Wann verwendet man Kreis und Balkendiagramme und was bilden sie ab?

A

Diskrete Merkmale mit nicht all zu vielen Ausprägungen, stellen absolute und relative Häufigkeiten dar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Wann verwendet man Histogramme und was bilden sie ab?

A

Bei quantitativen Merkmalen mit vielen Ausprägungen. Stellen absolute und relative Häufigkeiten in Klassen zusammengefasst dar. Die Häufigkeit jeder Klasse wird durch eine Säule dargestellt. Es vermittelt einen Eindruck von Streuung, Lage und Form einer Häufigkeitsverteilung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Wie wählt man die Klassenbreite für ein Histogramm?

A

10log(n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Welche Formen der Häufigkeitsverteilungen gibt es?

A

unimodale (1 Gipfel), bimodale (2 Gipfel) und multimodale (>2 Gipfel).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Wie nennt man eine schiefe Verteilung?

A

Lognormalverteilung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Was sind die Maße der zentralen Tendenz?

A

Median, Modus, arithmetisches Mittel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Was beschrieben die Maße der zentralen Tendenz?

A

Die Lage einer Verteilung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Was sind Eigenschaften des arithmetischen Mittels?

A

nur ab Intervallskale oder höher sinnvoll, muss nicht mit einer beobachteten Ausprägung übereinstimmen, ist ausreißerempfindlich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Was ist die Idee des Medians?

A

Gesucht ist ein Wert, der größer als die eine Hälfte der Beobachtungen und gleichzeitig kleiner als die andere Hälfte der Beobachtungen ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

Was sind Eigenschaften des Medians?

A

Lagemaß für auf Ordinalskalenniveau oder höher erfasste Variablen, robust gegenüber Ausreißern. Auch auf Intervallskalenniveau sinnvoll, vor allem bei schiefer Verteilung. Muss nicht mit beobachteten Ausprägungen übereinstimmen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

Was sind die Eigenschaften des Modus?

A

Lagemaß für Variablen auf Nominalskalenniveau oder höher, ist die am häufigsten vorkommende Ausprägung, bei mehreren Maxima wird die kleinere Zahl angegeben, robust gegenüber Ausreißern.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

Was sind zulässige Transformationen für die Maße der zentralen Tendenz?

A

Alle sind äquivariant gegenüber linearen Transformationen und können retranformiert werden. Modus und Median können auch nach streng monotonen Transformationen retranformiert werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

Was sind Quantile?

A

Sie teilen einen Datensatz mit n Beobachtungen in einem bestimmten Verhältnis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

Was sind die Eigenschaften des p-Quantils?

A

0<p></p>

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Was ist, wenn np des Quantils ganzzahlig ist?

A

yp ist der Mittelwert von np und np+1, in der Liste der geordneten Beobachtungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

Was ist, wenn np des Quantils nicht ganzzahlig ist?

A

yp befindet sich in der Liste an der Position, die sich ergibt, wenn man np aufrundet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q

Was sind andere Bezeichnungen für das y.25 und y.75 Quantil?

A

Oberes und Unteres Quartil.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q

Wie nennt man y.10, y.20, y.30 usw.

A

Dezile.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
58
Q

Was beschrieben Streuungsmaße?

A

Die Variabilität der Beobachtungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
59
Q

Was ist die Spannweite?

A

Range: dR=ymax-ymin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
60
Q

Was ist der Interquartilabstand?

A

dQ= y.75-d.25

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
61
Q

Was ist die Fünf-Punkte-Zusammenfassung?

A

ymin, y.25, ymed, y.75, ymax

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
62
Q

Was beschrieben Varianz und Standardabweichung?

A

Die Streuung bzw. Variabilität von Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
63
Q

Was sind Eigenschaften von Varianz und Standardabweichung?

A

Sind nur für quantitative Variablen sinnvoll, Die Standardabweichung wird zur Beschreibung einer Verteilung oft neben dem Erwartungswert angegeben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
64
Q

Was beschreibt die Varianz?

A

Die mittlere quadratische Abweichung der Beobachtungen von ihrem Mittelwert. Sie ist anfällig gegenüber Ausreißern

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
65
Q

Was ist die Standardabweichung?

A

Die positive Wurzel der Varianz. Sie erfasst die Streuung um den Mittelwert. Besteht keine Streuung ist s=0. Je größer die Streuung, desto größer die Standardabweichung. Sie ist anfällig gegenüber Ausreißern.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
66
Q

Wie sind die Merkregeln für den Schiefekoeffizienten?

A

gm=0: symmetrische Verteilung
gm>0: rechtsschiefe/linkssteile Verteilung
gm<0: linksschiefe/rechtssteile Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
67
Q

Was ist die Kurtosis?

A

Dyson-Finucan-Bedingung: Kurtotische Verteilungen schneiden die Normalverteilung mindestens zwei mal auf jeder Seite. Die Kurtosis gibt nicht Steilheit vs. Flachheit an, wird aber ungefähr so interpretiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
68
Q

Was sind die Merkregeln für den Kurtosiskoeffizienten?

A

y=0: Normalverteilung
y>0: steile Verteilung
y<0: flache Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
69
Q

Was ist die bivariate Statistik?

A

Gleichzeitige Betrachtung von zwei Variablen. Ziel: Beziehungen und Zusammenhang zwischen den Variablen erkennen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
70
Q

Wann besteht ein Zusammenhang zwischen Variablen?

A

Wenn das Auftreten von Werten einer Variablen tendenziell mit dem Auftreten von Werten einer anderen Variable einhergeht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
71
Q

Was ist eine unabhängige Variable?

A

Independent variable, UV, beeinflusst AV.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
72
Q

Was ist eine abhängige Variable?

A

dependent Variable, AV, wird von UV beeinflusst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
73
Q

Was ist ein Streudiagramm/Scatterplot?

A

Es zeigt die Beziehung zwischen zwei i.d.R quantitativen Variablen, Jede Variable ist eine Koordinatenachse, wobei die UV meist auf der x-Achse dargestellt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
74
Q

Was sind Kriterien für Zusammenhangskoeffizienten?

A

Sollten Zsmhang numerisch ausdrücken, Richtung angeben, invariant unter zulässigen Transformationen, einfach interpretierbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
75
Q

was sind posititv lineare Zusammenhänge?

A

Gleichsinnige Zusammenhänge

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
76
Q

Was sind negativ lineare Zusammenhänge?

A

Gegensinnige Zusammenhänge

77
Q

Was beschreibt die Kovarianz?

A

Sie bringt die Stärke des Zusammenhangs numerisch zum Ausdruck.

78
Q

Was sind Eigenschaften der Kovarianz?

A

Kovarianz=0, wenn kein linearer Zusammenhang besteht, positiv bei gleichsinnigem Zusammenhang und negativ bei gegensinnigen Zusammenhang. Sie gibt die Richtung des Zusammenhangs an und ist nicht invariant unter zulässigen Transformationen, sie ist numerisch schwer zu interpretieren. Ihr Maximum ist definiert als Sx*Sy.

79
Q

Was sind die Eigenschaften der (Pearson) Korrelation?

A

Sie erlaubt eine numerische Beschreibung der Richtung und der Stärke des Zusammenhangs zweier Variablen. Wird auch Produkt-Moment-Korrelation oder Pearsonscher Korrelationskoeffizient genannt. Sie macht keine Unterscheidung zwischen UV und AV. r liegt immer zwischen -1 und +1. Der Betrag der Korrelation ist höher, je stärker der Zusammenhang ist. 0=kein Zsmhang, negativ: gegensinniger, positiv: gleichsinniger. Invariant bei positiv linearen Transformationen, anfällig gegenüber Ausreißern.

80
Q

Wann sind Gesamtmittelwert und Gruppemittelwert gleich?

A

Wenn die Gruppen gleich groß sind.

81
Q

Was sind die Lageregeln der zentralen Tendenz?

A

yquer=ymed=ymod: symmetrische Verteilung
yquer>ymed>ymod: linkssteile/ rechtsschiefe Verteilung
yquer

82
Q

Von wo bis wo werden die Whiskers beim Boxplot gezeichnet?

A

Vom kleinsten Wert (ohne Ausreißer) bis zum unteren Quartil und vom oberen Quartil bis zum größten Wert (ohne Ausreißer).

83
Q

Wann spricht man bei einem Boxplot von Ausreißern?

A

Wenn sie 1,5dQ (Interquartilabstand) über oder unter dem Ende des Box liegen. Sie werden als Punkt eingezeichnet.

84
Q

Wann spricht man bei einem Boxplot von Extremwerten?

A

Wenn die Werte 3dQ über oder unter dem Ende der Boy liegen. Sie werden als Sternchen eingezeichnet.

85
Q

Wie sind die Konventionen nach Cohen zur Interpretation von Effektstärken?

A

r +/- .10= klein
r +/- .30= mittel
r +/- .50= groß

86
Q

Welchen Einfluss können Drittvariablen haben?

A

Sie können dafür Sorgen dass Korrelationen entstehen oder verschwinden.

87
Q

Was ist eine Scheinkorrelation?

A

Spurious correlation: Die Korrelation zweier Variablen hat keinen substanzwissenschaftlichen Grund, sondern wird durch eine Drittvariable hervorgerufen.

88
Q

Was ist eine verdeckte Korrelation?

A

Hidden Correlation: Zwischen zwei Variablen besteht keine Korrelation, da in Untergruppen der Stichprobe Korrelationen vorliegen, die sich gegenseitig aufheben.

89
Q

Was sind geeignete Zusammenhangsmaße für Variablen auf Ordinalskalenniveau?

A

Ränge und Rangreihen, Rangkorrelation nach Spearman, Tb, Gamma,

90
Q

Was sind Ränge und Rangreihen?

A

Ordnen Objekte nach einem bestimmten Kriterium und weisem ihm einen rank/Rang zu. Die Auflistung der Ränge wird als Rangreihe bezeichnet. Zwischen Rangreihen besteht ein Zusammenhang, wenn Ränge einer Reihe tendenziell mit Rängen der anderen Reihe auftreten.

91
Q

Was sind abgeleitet Rangreihen?

A

Rangreihen werden nicht immer direkt bestimmt, sie können auch aus Beobachtungen abgeleitet werden. Bspw. Beurteilung der Schwere von Verbrechen auf Skala mit Werten 1 bis 10.

92
Q

Was sind ties?

A

Bindungen. Bei Rangreihen kann es vorkommen, dass Objekte gleich beurteilt werden. Man sagt dann, dass Bindungen vorliegen.

93
Q

Wie nennt man die Rangkorrelation nach Spearman auch?

A

Spearmans r oder Spearmans rho.

94
Q

Was sind die Eigenschaften von Spearmans Rangkorrelationskoeffizient rs?

A

Wertebereich von -1 bis +1, Vorzeichen gibt die Richtung des Zusammenhangs an. Ist ein Maß des monotonen Zusammenhangs zweier Variablen an. Gibt gegensinnige und gleichsinnige Zusammenhänge an. Invariant unter streng monoton wachsenden Transformationen, falls nach der Transformation die Ränge neu bestimmt werden.

95
Q

Was wird in einer Kontingenztabelle dargestellt?

A

Die gemeinsame Häufigkeitsverteilung und die Randverteilungen.

96
Q

Was beschreiben bedingte bzw. konditionale Verteilungen?

A

Unterschiedliche Häufigkeiten für die Ausprägungen einer Variablen in Abhängigkeit von den Ausprägungen einer anderen Variable.

97
Q

Wie berechnet sich die bedingte relative Häufigkeit von bj von Y gegeben ai von X?

A

nij/ ni. (Zellhäufigkeit durch Zeilenrandsumme).

98
Q

Wie berechnet man die Prozentsatzdifferenz?

A
  1. Bestimmung der prozentualen Anteile pro Zeile (Zelle/ Zeilenrandsumme)
  2. Differenzbildung zwischen den Prozentsätzen der beiden Zeilen der bedingten Verteilungen.
99
Q

Was sind die Eigenschaften der Prozentsatzdifferenz?

A

Schwankungsbereich zwischen -100% bis +100%. Bei 0% liegt keine Assoziation zwischen den Variablen vor. Einfach zu interpretierendes Maß.

100
Q

Wie berechnet sich das Absolute Risiko?

A

nij/ Randsumme

101
Q

Wie berechnet sich das relative Risiko?

A

nij/ Randsumme

102
Q

Wozu kann die Odds und Odds Ratio verwendet werden?

A

Als Alternative zu den Risikomaßen.

103
Q

Wie berechnet sich die Odds und Odds Ratio?

A

(ni1j1/ni1j2)/(ni2j1/ni2j2).

104
Q

Wie berechnet sich die bedingte Verteilung?

A

a1b1/ Gesamt a , a1b2/ Gesamt b usw.

105
Q

Woraus basieren traditionelle Zusammenhangsmaße?

A

Auf der X^2-Statistik.

106
Q

Was ist die Idee der X^2 Statistik?

A

Vergleich der beobachtbaren Kontingenztabelle mit einer fiktiven Kreuztabelle, in der keine Beziehung zwischen den Variablen besteht (Indifferenztabelle). Je größer die Abweichung der beiden Tabellen voneinander, desto stärker ist der Zusammenhang.

107
Q

Was geschieht wenn zwischen Indifferenz und Kontingenztabelle kein Zusammenhang besteht?

A

Besteht kein Zusammenhang, so sollte die bedingte relative Häufigkeit einer beliebigen Ausprägung ai von X gleich der marginalen relativen Häufigkeit von ai sein, egal bzgl. welcher Ausprägung bj von Y bedingt wird.

108
Q

Was muss man tun um die X^2 Statistik zu berechnen?

A

Die Kontingenz- und Indifferenztabelle miteinander vergleichen.

109
Q

Was sind die Eigenschaften der X^2-Statistik?

A

Ist immer größer oder gleich Null. Besteht kein Zusammenhang, so ist der Wert Null. Je größer der Unterschied der Tabellen, desto größer der Wert. Kann unbegrenzt groß werden. Ist abhängig von der Gesamtzahl der Beobachtungen. Richtung eines Zusammenhangs wird nicht angezeigt, da nicht sinnvoll. Ändert sich nicht bei der Vertauschung von Zeilen und oder Spalten. Ist abhängig von der Zahl der Zeile der Spalten. Werte sind schwer interpretierbar.

110
Q

Was Messen die Zusammenhangsmaße für die X^2 Statistik?

A

Die “Unabhängigkeit”.

111
Q

Was ist ein Problem einiger Koeffizienten für die X^2 Statistik?

A

Im Wertebereich von 0 bis 1 können einige Koeffizienten den Wert 1 nicht erreichen (K, Cramers V).

112
Q

Was ist ein Zufallsvorgang?

A

Ein Zufallsvorgang (Zufallsexperiment) st ein Vorgang, dessen mögliche Resultate im Voraus festliegen, wobei jedoch ungewiss ist, welches Resultat bei der Durchführung im Einzelnen eintreten wird. Bsp.: Klausur (bestanden/nicht bestanden)

113
Q

Was ist Notwendig für systematische Beschreibung von Zufallsvorgängen?

A

Übersicht über mögliche Ergebnisse (Mengenlehre), Zuweisung von Wahrscheinlichkeiten zu den Resultaten (nach bestimmten Regeln).

114
Q

Was ist der Ergebnisraum?

A

Sample Space/ Stichprobenraum: Menge aller möglichen Ergebnisse eines Zufallsvorgangs. Wird mit Omega bezeichnet. Elemente des Ergebnisraums wird mit klein Omega (w) bezeichnet.

115
Q

Was sind Ereignisse/ Events?

A

Ereignisse sind Zusammenfassungen von Ergebnissen eines Zufallsvorgangs. Sie werden mit Großbuchstaben vom Anfang des Alphabets bezeichnet.

116
Q

Wie bezeichnet man ‘Teilmenge des Ergebnisraumes’ in Zeichen?

A

A (schräges u) Omega

117
Q

Wie wird “Element von” in Zeichen angegeben?

A

Kleines Epsilon

118
Q

Was ist die leere Menge und wie bezeichnet man sie?

A

Das unmögliche Ereignis {} oder Zeichen für Durchschnitt.

119
Q

Was ist das sichere Ereignis?

A

Der Ereignisraum Omega.

120
Q

Was ist in der Stochastik die Bedeutung der Mengenoperation “Durchschnitt” und wie stellt man sie dar?

A

und, dargestellt mit umgedrehtem “u”.

121
Q

Was ist in der Stochastik die Bedeutung der Mengenoperation “Vereinigung” und wie stellt man sie dar?

A

oder, mit einem “u”.

122
Q

Was ist in der Stochastik die Bedeutung der Mengenoperation “Komplement” und wie stellt man sie dar?

A

Verneinung/Gegenereignis (nicht), mit einem Strich über dem Ereignis

123
Q

Was ist eine disjunkte Menge?

A

Mengen die sich nicht schneiden, verwendet bei dem ausschließenden “oder”. (A und B= {}).

124
Q

Was ist das Komplement einer Menge?

A

Das Komplement einer Menge besteht aus allen Ergebnissen in Omega, die nicht zu A gehören. Es wird auch als Komplementärereignis bezeichnet.

125
Q

Warum und wie erfolgt das zuweisen von Wahrscheinlichkeiten zum Eintreten von Ereignissen?

A

Um den Grad der Ungewissheit hinsichtlich des Eintretens von Ereignissen. Erfolgt nach festen Regeln. Sind Zuweisungsregeln erfüllt, dann spricht man von Wahrscheinlichkeiten.

126
Q

Was ist die mathematische Wahrscheinlichkeitstheorie?

A

Definiert nicht, was Wahrscheinlichkeiten sind, legt nur fest, wie man mit Wahrscheinlichkeiten rechnet. Lässt unterschiedliche Interpretationen des Wahrscheinlichkeitsbegriff zu.

127
Q

Was ist der Subjektive Wahrscheinlichkeitsbegriff?

A

Zuordnung von Wahrscheinlichkeiten entsprechend subjektiver Annahmen, entspricht Grad persönlicher Überzeugung (Degree of belief).

128
Q

Was ist der Objektive/ Frequentistische Wahrscheinlichkeitsbegriff?

A

Dominant in der Statistik. Die frequentistische Interpretation bezieht sich i.d.R. auf die relative Häufigkeit mit der ein bestimmtes Resultat bei sehr häufiger und unabhängiger Wiederholung eines Zufallsexperiments beobachtet wird.

129
Q

Was ist die grundlegende Interpretation von Wahrscheinlichkeiten in der frequentistischen Interpretation?

A

Bei unabhängigen Wiederholungen eines Zufallsexperiments strebt die relative Häufigkeit für das Auftreten eines Ereignisses gegen seine Wahrscheinlichkeit. (ZGS)

130
Q

Wie wird die Wahrscheinlichkeit einem Ereignis zugeordnet?

A

P(A); Wahrscheinlichkeit von A.

131
Q

Wie wird die Wahrscheinlichkeit einer Variablen zugeordnet?

A

P(Y<100); Wahrscheinlichkeit des Ereignisses, das Y>100.

132
Q

Was sind die drei Axiome von Kolmogorow?

A

Nicht-Negativität: P(A) >/= 0 für jedes Ereignis A.
Normierung: P(Omega)=1
Additivität: Falls A und B= {}, so gilt P( A oder B)= P(A)+ P(B).

133
Q

Was gilt für die Wahrscheinlichkeit eines Komplementärereignisses?

A

P(A Komplement)= 1-P(A)

134
Q

Was gilt, wenn A in einem Ereignis B enthalten ist?

A

Die WS von A ist höchstens so groß wie die WS von B.

135
Q

Was ist die Laplace-Wahrscheinlichkeit?

A

Sie stellt eine Möglichkeit der Zuweisung von WS zu Ereignissen bei endlichen Ergebnisräumen dar.

136
Q

Wie berechnet sich die Laplace-Wahrscheinlichkeit?

A

P(A)= Anzahl günstiger Ergebnisse/ Anzahl möglicher Ergebnisse. Günstige Ergebnisse: Anzahl der Ergebnisse in A. Wird mit |A| bezeichnet und Mächtigkeit von A genannt. Bei der Laplace-WS besitzen alle Elementarereignisse die gleiche WS. (Bspw. Würfel).

137
Q

Wie lautet die Additionsregel für mehr als zwei disjunkte Ereignisse?

A

Falls A,B,C paarweise disjunkt: P(A oder B oder C)= P(A)+ P(B)+ P(C)

138
Q

Wann sind Ereignisse stochastisch unabhängig?

A

Wenn sich das Eintreten eines Ereignisses B nicht auf die Wahrscheinlichkeit eines Ereignisses A auswirkt.

139
Q

Wie wird die Regel zur Berechnung der stochastischen Unabhängigkeit genannt?

A

Multiplikationsregel.

140
Q

Was gilt für Komplementärereignisse von A und B im Bezug auf die stochastische Unabhängigkeit?

A

Sind A und B unabhängig, so sind auch A, Kompl. B und Kompl.A, B sowie Kpmpl.A, Kompl.B unabhängig.

141
Q

Was ist eine Zufallsvariable (random variable)

A

Eine Zufallsvariable (ZV) ist eine Variable, deren Wert das numerische Resultat eines Zufallsvorgangs ist. Sie ist eine Funktion, die jedem Element w des Ergebnisraumes eine Zahl Y(w) aus einem bestimmten Wertebereich zuordnet.. Der Wert einer ZV Y heißt “Realisierung von Y” und wird mit y bezeichnet.

142
Q

Wie kann man die Wahrscheinlichkeiten von ZVn berechnen?

A

Auf Grundlage der Verteilung der ZVn.

143
Q

Was gibt eine Wahrscheinlichkeitsverteilung an?

A

Welche Wahrscheinlichkeit jedes mit Hilfe von Y definierte Ereignis besitzt.

144
Q

Was ist eine diskrete ZV?

A

Sie kann endlich viele (oder abzählbar unendlich viele) Werte annehmen.

145
Q

Was ist eine stetige ZV?

A

Sie kann alle Werte in einem Intervall annehmen.

146
Q

Wie ist die Diskrete Gleichverteilung definiert?

A

Für ZV Y it k Ausprägungen y1,…,yk ist die Gleichverteilung: yi->P(Y=yi)=1/k für jede Ausprägung yi. Die Ws, dass Y einen bestimmten Wert annimmt, ist für alle Ausprägungen gleich. Diskrete Gleichverteilung entspricht somit auf der Ebene der ZVn der Laplace-WS.

147
Q

Wie wird die Verteilungsfunktion F bei einer diskreten ZV Y mit den k möglichen Ausprägungen y1,…yk definiert?

A

F(y)= P(Y= y)

148
Q

Wie wird der Wert F(y) für ein beliebiges y berechnet?

A

F(y)= P(Y= y) = Summe P(Y=y)= Summe pi.

149
Q

Was ist pi?

A

Die WS P(Y=yi)

150
Q

Wie wird die Verteilung einer stetigen ZVn angegeben?

A

Durch eine Wahrscheinlichkeitsdichte (oder kurz Dichte; probability Density function, PDF) .

151
Q

Was ist eine Wahrscheinlichkeitsdichte?

A

Eine Wahrscheinlichkeitsdichte f ist eine auf dem Wertebereich einer ZVn Y definierte Funktion mit den Eigenschaften: Die Dichte nimmt immer nicht negative Werte an. Die Fläche unter der Dichtefunktion hat den Wert 1.

152
Q

Was ist bei den Funktionswerten einer PDF zu beachten?

A

Sie haben keine inhaltliche Interpretation.

153
Q

Was ist die WS für das Auftreten eines exakten Werts einer stetigen ZV?

A

Immer Null. D.h. es gilt: P(Y=y)=0. Bei stetigen ZVn werden nur die Zeichen > oder < verwendet, >/= oder = haben die gleiche Bedeutung.

154
Q

Welche WS berechnet man für stetige ZVn?

A

Meist nur die WS in einem bestimmten Intervall, bspw.: P(a

155
Q

Wie berechnet man ein Intervall mit den Grenzen a und b für die WS einer ZVn?

A

Mit dem Integral mit den Grenzen a und b. Meist wird jedoch die Verteilungsfunktion (cumulative Distribution function, CDF) verwendet, die in tabellierter Form vorliegt.

156
Q

Was entspricht bei einer stetigen ZVn Y der Wert F(y) der Verteilungsfunktion?

A

Die Fläche links unter der Dichte bis zur Stelle y .

157
Q

Was ordnet die Verteilungsfunktion F einer stetigen ZVn Y zu?

A

Jedem Wert y aus dem Wertebereich von Y wird eine WS zugeordnet, dass Y einen Wert annimmt, der höchstens so groß ist wie y ist.

158
Q

Wie berechnet man die WS einer stetigen ZVn P(Y<b></b>

A

=F(b)

159
Q

Wie berechnet man die WS einer stetigen ZVn P(a

A

=F(b)- F(a)

160
Q

Wie berechnet man die WS einer stetigen ZVn P(Y>a)

A

=1-F(a)

161
Q

Was sind Werte, welche die Verteilung einer ZVn charakterisieren?

A

Erwartungswert E(Y) oder mü bzw. müY; Varianz: Var(Y), oder sigma^2 bzw. sigma^2Y; Standardabweichung: Sigma oder SigmaY. Sie erfordern keine Beobachtungen (Daten).

162
Q

Was ist eine Bernoulli-Variable?

A

Eine ZV Y, die nur die Werte 0 oder 1 annehmen kann.

163
Q

Was bezeichnen 0 und 1 bei einer Bernoulli-Variable?

A

0= Misserfolg, 1=Erfolg

164
Q

Wie wird p bei einem Bernoulli-Experiment noch bezeichnet und für 0 und 1 definiert?

A

p= Erfolgswahrscheinlichkeit, P(Y=0)=1-p, P(Y=1)=p

165
Q

Wie wird E einer Bernoulli-Variablen Y berechnet?

A

E(Y)= 0(1-p)+1p

E(Y)=p

166
Q

Wie kann der Erwartungswert einer ZV interpretiert werden?

A
  1. Gewichtetes Mittel der möglichen Ausprägungen einer Zufallsvariablen, wobei die Wahrscheinlichkeiten die Gewichte darstellen.
  2. Mittelwert der Versuchsausgänge, die sich bei einer großen Zahl von unabhängigen Wiederholungen eines durch Y beschriebenen Zufallsexperiments ergeben (Gesetz der großen Zahlen).
167
Q

Was besagt das Gesetz der großen Zahlen?

A

Der Mittelwert strebt gegen den Erwartungswert.

168
Q

Wie definieren sich Quantile bei Wahrscheinlichkeitsverteilungen?

A

Für eine stetige/diskrete ZV Y mit einer Verteilungsfunktion F ist das p-Quantil yp zur Wahrscheinlichkeit 0<p></p>

169
Q

Wann sind zwei diskrete ZV X und Y stochastisch unabhängig?

A

P(X=x, Y=y)= P(X=x)*P(y=y)

170
Q

Wann sind zwei stetige ZV X und Y stochastisch unabhängig?

A

P(X

171
Q

Was sind unabhängig identisch verteilte ZVn?

A

Sie werden in vielen statistischen Verfahren vorausgesetzt. ZVn Y1,…,Yn entsprechen einer Zufallsstichprobe vom Umfang n. Sie besitzen alle die gleiche Verteilung (identisch verteilt) und daher auch den gleichen Erwartungswert mü und die gleiche Varianz sigma^2.

172
Q

Was gilt für die Varianzen von unabhängig identisch verteilten ZVn?

A

Die Varianz der Summe Y1+…+Yn= Summe der Varianzen und Var(Y1+…+Yn)=n*sigma^2

173
Q

Was definiert die stetige Gleichverteilung (uniform Distribution)?

A

Dichte, Verteilung von ZV mit Werten in einem Intervall mit Grenzen a und b, Symmetrische Verteilung, Symbol: U(a,b), Einfachste stetige Verteilung. (stetige Gerade von a bis b auf gleichbleibender Höhe f(a)/f(b)):

174
Q

Was sind Eigenschaften der Normalverteilung?

A

Bereich von y geht von -Unendlich bis +Unendlich. Die Dichte berührt niemals die X-Achse. Eine bestimmte NV wird durch die Parameter mü und Sigma>0 festgelegt: N(mü,Sigma)-Verteilung.

175
Q

Was sind die Eigenschaften der Standardnormalverteilung?

A

N(0,1)-Verteilung= SNV. Die Verteilungsfunktion der SNV wird mit Phi bezeichnet und liegt in tabellierter Form vor. Für NV mit beliebigen Parametern mü und Sigma kann die Berechnung der WS auf Berechnungen für die SNV zurückgeführt werden (durch Standardisieren).

176
Q

Was geschieht durch die Standardisierung von ZVn?

A

Die resultierende ZV Z hat immer einen E(Z)= 0 und eine Var(Z)= 1. Voraussetzung dafür ist, dass die ZV Y eie Verteilung besitz.d

177
Q

Was geben Standardisierte Werte einer ZV Y an?

A

Sie geben an, um wie viele Standardabweichungen Beobachtungen vom Erwartungswert von Y abweichen.

178
Q

Wie wird das p-Quantil bei der SNV bezeichnet?

A

zp statt yp

179
Q

Wie werden Quantile der SNV für p

A

zp= -z 1-p

180
Q

Welche Regel gibt es um gängige WS von Beobachtungen i bestimmten Grenzen anzugeben?

A

Die 68-95-97.5-Regel

181
Q

Was besagt die 68-95-97.5-Regel?

A

Bei jeder N(mü, Sigma)verteilten ZV liegen 68% der möglichen Werte zwischen mü-sigma und mü+sigma, 95% liegen zwischen mü +/- 2*Sigma, 99.7% liegen zwischen mü+/- 3+Sigma.

182
Q

Was besagt der Zentrale Grenzwertsatz (ZGS)?

A

Sind Y1,…,Yn unabhängige, identisch verteilte ZVn mit E=mü und Varianz=sigma^2 so ist die Stichprobenverteilung des Mittelwerts Y für großes n approximativ normal.

183
Q

Wann handelt es sich um ein Bernoulli-Experiment?

A

Es gibt eine feste Zahl von n Wiederholungen/Durchführungen, Alle Wiederholungen sind unabhängig, Das Ergebnis jeder Wiederholung kann eine von zwei Kategorien (Erfolg/Misserfolg) sein, Die WS p für Erfolg ist bei jeder Wiederholung gleich.

184
Q

Wie bezeichnet man eine Bernoulli-Verteilung?

A

B(n,p)-Verteilung

185
Q

Wie legt man Erfolge von Bernoulli-Exprimenten fest?

A

Jeder Anzahl von Erfolgen y entsprechen bestimmte Ergebnismuster, bei den n Wiederholungen, z.B. (M,E,E,M,E). Alle Muster mit y Erfolgen haben die gleiche WS.

186
Q

Wie berechnet man die WS bei Bernoulli-Experimenten?

A

P(Y=y) ist die Summe der WS aller Muster mit y Erfolgen. Dabei stellt sich die Frage, wie viele Muster es mit y Erfolgen gibt.

187
Q

Wie werden Einzelne Wiederholungen bei Bernoulli-Experimenten beschrieben?

A

Mit Y1,…,Yn: Y=Y1+…+Yn, WS: P(Y1=1, Y2=0,…,Yn=0) o.ä.

188
Q

Wie berechnet sich die WS bei unabhängigen Wiederholungen mit y Erfolgen bei n Wiederholungen?

A

p^y*q^n-y

189
Q

Womit kann man die Anzahl der möglichen Muster bei Bernoulli-Experimenten berechnen?

A

Mit dem Binomialkoeffizienten (n über y).