Statistik 1&2 Flashcards

1
Q

Was bedeutet Messen in der Psychologie?

A

Unter Messen versteht man die Zuordnung von Zahlen zu Objekten nach bestimmten Regeln, die gewährleisten, dass bestimmte interessierende Relationen in der Menge der Objekte (empirische Relationen) in der Menge der Zahlen (nummerische Relationen) erhalten bleiben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist das Eindeutigkeits-, Repräsentations-, Bedeutsamkeitsproblem?

A

 Eindeutigkeitsproblem
- Das Eindeutigkeitsproblem stellt die Überlegung an, wie man die Zahlen im numerischen Relativ verändern (transformieren) kann, ohne dass die Strukturerhaltung gefährdet ist.
- je höher die Skala, desto weniger Transformationen zulässig
 Repräsentationsproblem:
- Beschäftigt sich mit der Frage, wie ein empirisches Relativ aussehen muss, damit es homomorph durch ein nummerisches Relativ repräsentiert wird.
 Bedeutsamkeitsproblem:
- Beschäftigt sich mit der Frage, welche Aussagen über Merkmalsausprägungen aufgrund der Zahlenzuordnung bedeutsam sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen

Nominal

A

 Nominalskala
- Klassifikation von Objekten nach gleich oder ungleich
- Anforderung:
• Äquivalenzrelation
a. Reflexiv (Element steht in Relation mit sich selbst)
b. Symmetrisch (wenn u mit v in Relation steht, muss auch v mit u in Relation stehen)
c. Transitiv (wenn u mit v und v mit w in Relation steht, muss auch u mit w in Relation stehen)
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
- Transformationen
• Eineindeutige Transformationen (Unterschiedlichkeit der Werte bleibt erhalten)
• Monotone Transformationen (Rangordnung der Werte bleibt erhalten)
• Positiv lineare Transformationen (Verhältnisse zwischen Differenzen bleiben erhalten)
• Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
• Identitätstransformationen („keine Transformation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen

Ordinal

A
	Ordinalskala
-	Klassifikation & Ordnung von Objekten nach bestimmten Kriterien 
-	Anforderung: 
•	Strenge Ordnungsrelation
a.	Asymmetrisch
b.	Transitiv
  • Aussagen
    • Aussagen über Gleichheit und Verschiedenheit von Werten
    • Aussagen über die Rangfolge von Werten (größer, kleiner, gleich)
  • Transformationen
    • Monotone Transformationen (Rangordnung der Werte bleibt erhalten)
    • Positiv lineare Transformationen (Verhältnisse zwischen Differenzen bleiben erhalten)
    • Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
    • Identitätstransformationen („keine Transformation)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen

Intervall

A

 Intervallskala
- Klassifikation & Ordnung & Größe von Abständen von Objekten
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
• Aussagen über die Rangfolge von Werten (größer, kleiner, gleich)
• Aussagen über die Größe der Verschiedenheit von zwei Abständen
- Transformationen
• Positiv lineare Transformationen (Verhältnisse zwischen Differenzen bleiben erhalten)
• Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
• Identitätstransformationen („keine Transformation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen

Verhältnis

A

 Verhältnisskala
- Merkmalsausprägungen haben einen natürlichen Nullpunkt
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
• Aussagen über die Rangfolge von Werten (größer, kleiner, gleich)
• Aussagen über die Größe der Verschiedenheit von zwei Abständen
• Aussagen über das Verhältnis zweier Werte
- Transformationen
• Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
• Identitätstransformationen („keine Transformation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen

Absolut

A

 Absolutskala
- Merkmalsausprägungen haben einen natürliche Absolutausprägung
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
• Aussagen über die Rangfolge von Werten (größer, kleiner, gleich)
• Aussagen über die Größe der Verschiedenheit von zwei Abständen
• Aussagen über das Verhältnis zweier Werte
• Aussagen über die absolute Ausprägung eines Merkmals
- Transformationen
• Identitätstransformationen („keine Transformation“)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
  1. Wie können Sie empirisch prüfen, ob die von Ihnen gemessene Variable den Ansprüchen an eine Ordinalskala genügt?
A

 Durch die Bildung von paarweisen Vergleichen (vollständiger Paarvergleich )
- Es muss strenge Ordnungsrelation vorliegen, diese ist Asymmetrisch & transitiv
- Asymmetrisch= wenn u mit v in Relation, steht v nicht mit u in Relation
- Transitiv = wenn u mit v in Relation und v mit w, dann auch u mit w
 Anwendung einer vorgegebenen Ordinalskala
 Direkte Bildung einer Rangordnung einer Objektmenge

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q
  1. Welche Aussagen über die den Merkmalsträgern zugeordneten Werte sind bei einer intervallskalierten Variablen möglich?
A

 Aussagen über Gleichheit, Ordnung und Größe der Verschiedenartigkeit (Vergleiche von Differenzen zwischen Paaren von Merkmalsträgern)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q
  1. Zentrale Tendenz von Skalenniveaus
A

 Nominal: Modus
 Ordinal: Median (bei Antwortkategorien kann auch Modus interessant sein)
 Intervall: arithmetisches Mittel, oder bei Verteilungen mit Ausreißern: Modus
 Verhältnis: arithmetisches Mittel
 Absolut: arithmetisches Mittel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  1. Beispiele Skalenniveau
A

 Nominal: Studiengang, Geschlecht, Geburtsort, Störungsbild
 Ordinal: Extraversion anhand von Likert-Skala, Schulnote, Bildungsabschluss
 Intervall: Temperatur in Celsius, Intelligenz
 Verhältnis: Alter, Länge, Temperatur in Kelvin, Reaktionszeit
 Absolut: Anzahl an Versuchen, Anzahl der Tore in einem Fußballspiel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q
  1. Was ist Deskriptivstatistik?
A

 Die Deskriptivstatistik dient zur Beschreibung nummerischer Daten, die in der Psychologie meist Probanden hinsichtlich ihrer Merkmalsausprägung beschreiben. Es lassen sich Aussagen über Merkmalsunterschiede und Zusammenhänge treffen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
  1. Median, Mittelwert und Modus als Kriterium der Lageparameter. Was machen die mit der Verteilung? Nach welchem Kriterium repräsentieren sie die Verteilung? -> Vergleichen
A

 Median:
- teilt die Verteilung in zwei gleich große Hälften, wobei jede Hälfte die gleiche Häufigkeit hat (50% sind kleiner & 50% sind größer als der Median)
- Er repräsentiert die Lage der Verteilung nach dem Kriterium der kleinsten Absolutabweichung.
- Bei Verteilungen mit Ausreißerwerten repräsentiert der Median den Mittelpunkt (die zentrale Tendenz) der Verteilung besser als der Mittelwert.
 Modus
- Die Merkmalsausprägung, die am häufigsten vorkommt (die Kategorie, nicht die Häufigkeit)
- Kann nicht eindeutig bestimmt werden, wenn mehrere Kategorien gleichhäufig besetzt sind
 Mittelwert /arithmetisches Mittel:
- ist der durchschnittlicher Wert, er teilt die Summe aller beobachteten Merkmalswerte durch die Anzahl der Beobachtungen
- Er repräsentiert die Lage der Verteilung nach dem Kriterium der kleinsten Quadrate.
- Sensibel für Ausreißer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
  1. Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Stammblatt
A
  • Werte werden in Stamm & Blätter zerlegt
  • Die Stammbreite gibt an, wie hoch die Zahl des Stammes ist (zB Stem width 1,00 heißt, dass Stamm „6“ für den Wert 6 steht, bei 10,00 würde der Wert für 60 stehen) und dementsprechend auch die der Blätter (bei 1,00 stem width steht der Wert des Blattes für die erste Nachkomma stelle, bei 10,00 für die erste Zahl vor dem Komma)
  • Die Häufigkeit gibt an, wie oft ein Stammwert aufgetreten ist, also wie viel Blätter es an diesem Stamm gibt (da zählen bei vielen Werten zu aufwändig wäre)
  • Auch wird angegeben, wie viele Personen hinter einem Blatt stecken (bei each leaf 1 case hat genau eine Person den Wert 6,2 erreicht, bei zb 5 hätten 5 Personen den Wert 6,2 erreicht)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
  1. Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Histogramm
A

 Histogramm

  • Zwar aussehen wie Säulendiagramm, jedoch keine Abstände zwischen den Säulen
  • Breite der Säulen sinnvoll interpretierbar -> ist auf Zahlenstrahl angeordnet (Abstand bedeutsam)
  • Auch Fläche sinnvoll interpretierbar; sind proportional zu absoluten und relativen Häufigkeiten -> man sieht an Flächen schnell, wie sich die Untersuchungsobjekte auf die Merkmalsausprägungsbereiche verteilen
  • x-Achse: Merkmal in seinen Ausprägungsstufen (durch Kategorienbildung entstanden)
  • y-Achse: Häufigkeiten, mit denen die einzelnen Messwertkategorien besetzt sind
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  1. Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Polygonzug
A

Ist die Darstellung eines Histogramms als Linie, wobei der Ansatzpunkt der Mittelpunkt der einzelnen „Säulen“ des Histogramms ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q
  1. Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Box-Plot
A
  • Darstellung von Häufigkeitsverteilungen, in der neben dem Median als Bezugspunkte außerdem der größte und der kleinste Ausprägungswert sowie die Quartile (Viertelwerte) & Ausreißer vermerkt sind
  • Median =Mittlerer Wert
  • Quartile =
    x Werte an Stelle n0,25 & n0,25+1 -> aufrunden
    Q1 = 1/2 (x1+x2)
    x Werte an Stelle n0,75 & n0,75+1
    Q3 = 1/2 (x3 + x4)
  • Whisker
    IQA= Q3 - Q1
    oberer: Q3 + (1,5 * IQA) -> alles darüber ist Extremwert
    unterer: Q1 - (1,5*IQA) -> alles darunter ist Extremwert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q
  1. 5 Punkte-Zusammenfassung
A
  • x Minimum
  • Q1
  • Median
  • Q3
  • x Maximum
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q
  1. Eine Darstellungsmöglichkeit für nominalskalierte Daten nennen, zeichnen und beschriften
A

 Balken- bzw. Säulendiagramm

 Kreisdiagramm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q
  1. Worin unterscheiden sich singuläre Variablen, Variablen mit Rangbindung und Variablen mit geordneten Antwortkategorien? Bei welcher Art von Messung erhalten Sie welche Art von Variable?
A

 Bei ordinalskalierten Daten

  • Singuläre Variablen sind Variablen, bei denen jeder Wert nur maximal einmal vergeben wird / vorkommt (z.B. Wettläufe)
  • Variablen mit Rangbindung sind Variablen, bei denen es vorkommen kann, dass sich zwei Merkmalsträger einen Rang teilen (z.B. bei einem Wettlauf kommen zwei Personen gleichzeitig im Ziel an)
  • Variablen mit geordneten Antwortkategorien: Merkmalsträger werden geordneten Kategorien zugeordnet, es gibt mehrere Merkmalsträger pro Rangkategorie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q
  1. Was wird mit Varianz gemessen? Varianz ist höher als ein anderes Merkmal. Was bedeutet das?
A

 Streuungsmaß für metrisch skalierte Variablen
 Die Varianz ist das arithmetische Mittel der quadrierten Abweichung der Messwerte vom Median  mittlere quadrierte Abweichung
 gibt an wie weit Werte vom Mittelwert streuen – je größer die Varianz, desto größer die Streuung
 Durch die Varianz wird die Unterschiedlichkeit der Messwerte in einer Stichprobe berechnet
 Wenn also die Varianz eines Merkmals höher ist, als die eines anderen, dann streuen die Werte des Merkmals stärker um den Mittelwert, sie sind heterogener als die des Merkmals mit geringerer Varianz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q
  1. Standardabweichung
A

 Positive Quadratwurzel der Varianz
 Um wie weit streuen die Werte in Skaleneinheiten
 Bei Normalverteilung liegen im Bereich Mittelwert – Standardabweichung bis Mittelwert + Standardabweichung 64,2 % der Werte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q
  1. Was bringt die z-Standardisierung? Welchen Mittelwert, welche Standardabweichung haben sie?
A

 Bei der z-Standardisierung wird die Abweichung eines Wertes zum Mittelwert an der Standardabweichung relativiert
 Man kann berechnen, wie viele Standardabweichungen ein spezifischer Wert vom Mittelwert entfernt ist (eine z Einheit = eine Standardabweichung)
 durch die z-Standardisierung lassen sich Ergebnisse verschiedener Studien, die mit unterschiedlichen Messinstrumenten gemessen wurden, vergleichbar machen
 und Bezug zu einer Vergleichsgruppe nehmen
 Verteilung z-transformierter Werte hat Mittelwert = 0, Standardabweichung = 1

24
Q
  1. Wann wird welches Zusammenhangsmaß verwendet?
A
	Nominal 
-	Cramers V
-	Chi2  (sieht aus wie: x2)
	Dichotom & Dichotom 
-	Phi – Koeffizient φ (entspricht P-M-Korrelation)
-	Odd-Ratio
-	Yules Q (entspricht Gamma-Koeffizient)
	Ordinal 
i.	Ordinal Singulär
-	Kendalls tau (ohne Rangbindung)
-	Wilson e (mit Rangbindung)
	Ordinal & Ordinal
i.	Ordinal Rangklassen
-	Gamma Koeffizient γ
	Metrisch & Metrisch 
i.	Produkt-Moment Korrelation /bravais-pearson
25
Q
  1. Was ist das grundlegende Prinzip bei nominalskalierten Korrelationsmaßen/Assoziationsmaßen?
A

 Beziehen sich nicht auf die Ausprägung der Skalenwerte sondern auf Häufigkeit des Auftretens, da Variablen nur die Werte gleich oder ungleich annehmen können
 Es können keine quantitative Aussagen sondern nur qualitative gemacht werden

26
Q
  1. Erkläre die Bavaris-Pearson-Korrelation. Bei welchen Daten wird sie verwendet? Welche Werte kann die Effektstärke annehmen?
A

 Metrische Daten
 Kovarianz (Maß für linearen Zusammenhang zweier Variablen) wird an den Standardabweichungen der beiden Merkmale relativiert -> Standardisierte Kovarianz der Merkmale, so dass diese skalierungsunabhängig & damit vergleichbar sind
 Kann Werte von -1 bis 1 annehmen, wobei r= ,10 (schwacher Effekt), =,30 (mittlerer Effekt) =,50 (starker Effekt), =0 (kein Zusammenhang) oder =1 (perfekter Zusammenhang)
 Negative Korrelation heißt: Werte einer Merkmales werden stärker während Werte des anderen abnehmen

27
Q
  1. Welche oder was für ein Zusammenhang muss zwischen zwei Variablen sein um Produkt-Moment-Korrelation zu berechnen? Was sagt diese Korrelation aus?

A

 Linearer Zusammenhang
 Gibt die Stärke eines linearen Zusammenhangs zweier Merkmale durch Korrelationskoeffizienten r an, der zwischen -1 und 1 liegen kann.

28
Q
  1. Grundidee von Kendalls tau & Wilsons e. Was passiert da? Was ist die Idee dahinter? + Gamma-Koeffizient
A

 Zusammenhangsmaß bei Ordinalskalierten Daten ohne Rangplatzbindung (Kendalls tau) bzw. mit Rangplatzbindung (Wilsons e)
 Setzten Konkordanzen und Diskordanzen ins Verhältnis, wobei Konkordanz meint, dass die Beziehung beider Merkmale gleich ist (zB Vergleich Person A & B, A hat höhere Leistung und höhere Anstrengung) und Diskordanz meint, dass die Beziehung beider Merkmale ungleich sind (Vergleich Person C&D, C hat höhere Leistung aber niedrigere Anstrengung)
 Gibt es mehr Konkordanzen als Diskordanzen, besteht ein positiver Zusammenhang zwischen den Merkmalen, bei mehr Diskordanzen als Konkordanzen besteht ein negativer Zusammenhang zwischen den Merkmalen.
 Nach allen möglichen Paarvergleichen:
 -1 = nur Diskordanzen – perfekter negativer Zusammenhang
 1 =nur Konkordanzen - perfekt positiver Zusammenhang
 0 kein Zusammenhang

29
Q
  1. Was ist Odds/Odds Ratio?
A

 Odds = „Chance“ = das Verhältnis zweier Häufigkeiten, also die geschätzte Wahrscheinlichkeit, dass jemand eher Kategorie a) oder Kategorie b) angehört
 Odds Ratio = Zusammenhangsmaß für dichotome Variablen; Wettquotientenverhältins; ein Verhältnis (ratio), das zwei Chancen (Odds) miteinander vergleicht

30
Q

Was bedeutet es, wenn Odds = 2, und was, wenn Odds Ratio = 2 ist?

A

 Wenn ein Odds = 2 ist, bedeutet es, dass die Chance, dass eine VP, die auf Faktor A der Ausprägung 1 angehört ( zB Krankheitsbild 1), auf Faktors B der Ausprägung 1 (zB Studiengang Psychologie) angehört 2-mal so hoch wie, wie die Chance, dass sie Ausprägung 2 (zB Studiengang Medizin) angehört

 Wenn das Odds Ratio den Wert 1 annimmt, sind die beiden Variablen unabhängig voneinander.
 Beide Odds sind gleichgroß, es ist gleichwahrscheinlich, dass die Person der ersten Ausprägung oder zweiten Ausprägung angehört
 Ist der Wert größer als 1, dann ist das Verhältnis im Zähler größer als im Nenner, und es besteht somit ein gleichsinniger Zusammenhang. Ist der Wert kleiner als 1, dann ist das Verhältnis im Nenner größer als das Verhältnis im Zähler, und es besteht somit ein gegensinniger Zusammenhang.
 Achtung: Die Interpretation der Richtung des Zusammenhangs muss immer auf die Anordnung der Kategorien bezogen werden; die Stärke des Zusammenhangs ändert sich jedoch nicht

 Ist ein Odds Ratio = 2, bedeutet das also, dass ein gleichsinniger Zusammenhang zwischen den geprüften Variablen vorliegt
 Wenn ich bei Faktor A Ausprägung 1 habe, ist es doppelt so wahrscheinlich, dass ich bei Faktor B Ausprägung 1 als Ausprägung 2 habe

 OR =
Chance für Faktor B 1. Ausprägung unter Bedingung Faktor A 1. Ausprägung /
Chance für Faktor B 1. Ausprägung unter Bedingung Faktor A 2. Ausprägung

Chance für Faktor B Ausprägung 1. Bei Faktor A Ausprägung 1 um…% geringer als bei Faktor A Ausprägung 2

31
Q
  1. Welchen Zusammenhang hat bs (Standardisierter Korrelationskoeffizient) mit dem Korrelationskoeffizienten? (Korrelation) (Wenn nur Korrelations steht, immer P-M-Korrelation gemeint)
A

 B = Regressionsgewicht (für Steigung der Regressionsgeraden wichtig) aus Korrelationskoeffizient und Varianz zweier Variablen
 Bs = standardisiertes Regressionsgewicht; ist mit Korrelationskoeffizient identisch

32
Q
  1. Was besagt eine Korrelation von 0.5/-0.5? Wäre es sinnvoller gewesen, eine Regression zu berechnen?
A

 Da Korrelation und Regression unterschiedliche Interpretationen erlauben, kann man nicht sagen, dass das eine oder andere besser wäre
 Es macht allerdings nur Sinn eine Regression zu rechnen, wenn man bereits einen Zusammenhangseffekt gefunden hat
 Bei 0,5 ist dieser relativ stark

33
Q
  1. Ein Freund hat eine Korrelation von -0.5 errechnet und bekommt von einer Kommilitonin den Ratschlag mit einer Regression könnte er von seiner X-Variable auf die Ausprägung in der Y-Variable schließen. Beziehe Stellung!
A

 Eine Korrelation von -0.5 wird in der Psychologie bereits als starker Effekt gesehen, es kann also Sinn machen, eine Regression zu rechnen, um Ergebnisse folgender Studien vorhersagen zu können
 Eine Korrelation von -0,5 besagt weiterhin, dass während die Werte einer Variable ansteigen, die Werte der anderen Variable fallen

34
Q
  1. Bedeutung der einzelnen Koeffizienten einer Regressionsgleichung beschreiben (ym, bx1, em), Regressionsgleichung aus gegebenen Daten erstellen und Ergebnisse interpretieren, wie man b0 und b1 interpretiert
A

 Regressionsgleichung y= b0 + b1 * xm + em
 Y: AV, soll optimal vorhergesagt werden (Ŷ), Regressant
 X: UV, Regressor
 b0= Regressionskoeffizient (additive Konstante, Achsenabschnitt, Schnittpunkt mit der y-Achse)
- derjenige ŷ-Wert, dem die Regressionsfunktion einen x-Wert von 0 zuordnet
- = Mittelwerty – b1Mittelwertx
 b1=Regressionsgewicht (Steigung)
- um wie viele Einheiten Y zunimmt, wenn X um eine Einheit zunimmt; für alle Merkmalsträger gleich
- = r
(sy/sx) bzw. = sxy/s2x
- man nimmt zwei y-Werte und zwei x-Werte, bildet die Differenzen zwischen den beiden y-Werten (dy) und den beiden x-Werten (dx)
dann dy durch dx teilen (dy/dx) -> Steigung
 em: Fehlerwerte, Regressionsresiduum (Differenz zwischen vorhergesagtem Wert und tatsächlichem Wert)

 anders erklärt:
 Y = Kriterium AV
 X = Prädiktor UV
 B0 = Achsenabschnitt ist der vorhergesagt y-Wert, der sich ergibt, wenn man für den Prädiktor (x) Null einsetzt; nur sinnvoll interpretierbar, wenn der Wert Null wirklich zu erreichen ist
- Standardisiert: Achsenabschnitt ist der vorhergesagt y-Wert, der sich ergibt, wenn man für den Prädiktor (x) Null einsetzt, fällt dann weg, weil durch die Standardisierung alle Variablen einen Mittelwert von 0 haben
 B1= Steigungskoeffizient gibt an, um wie viel sich das vorhergesagte Kriterium ändert, wenn man den Prädiktor um eine Einheit verändert
- Standardisiert: gibt an, um wie viele SA-Einheiten AV zunimmt, wenn x um eine Standardabweichungseinheit zunimmt
 Em = Residuum, Fehlerwert (Differenz zw. Vorhergesagtem Wert und tats. Wert)

35
Q
  1. Wie lauten die Regressionsgewichte bei standardisierten Werten?
A

 Ermöglicht der Vergleich verschiedener Studien (mit unterschiedlichen Messinstrumenten)
 geht nur darum, wie eng der Zusammenhang ist, nicht um Vorhersagen
 bei standardisierter Regression geht die Regressionsgerade immer durch den Ursprung des Koordinatensystems
 Index s zeigt, dass Werte standardisiert wurden
 zy = 0 + rxy * zx (zx = eine Einheit Standardabweichung)
 b0s=0
- da Mittelwert von Standardisierten Variable x=0, Mittelwert von standardisierten Variable y=0, Standardabweichung=1
 b1s=rxy (Produkt-Moment-Korrelation),
i. zwischen -1 und +1; je steiler die Gerade, desto höher die Korrelation
- bs1: (Standardisiert) Um wie viele Standardabweichungs-Einheiten die AV zunimmt, wenn X um 1 Einheit SA zunimmt

36
Q
  1. Worin unterscheiden sich die Interpretation von standardisierten und unstandardisierten Regressionskoeffizienten?
A

 Unstandardisiert:
- beziehen sich auf die vorliegenden Werte und die zur Messung eingesetzten Skalen.
- direkt unter Berücksichtigung der Skalierung zu interpretieren.
- Vorhersage konkreter erwarteter Werte
- Vergleich verschiedener Gruppen , die mit dem selben Messinstrument gemessen
 Standardisierte
- beziehen sich auf Einheiten der Standardabweichung
- Information bzgl. der Skalen sind nicht mehr enthalten
- Ermöglichen Vergleich verschiedener Gruppen die mit unterschiedlichen Messinstrumenten gemessen wurden.

37
Q
  1. Ergänzen einer Tabelle zur linearen Regression (R² eintragen) und interpretieren
A
  • Anteil der systematischen Varianz der der Gesamtvarianz
  • Bei gegebenen bs1 (entspricht der Korrelation) entspricht R2 dem quadriertem Wert (Korrelation2)

R2 = Varianz geschätzte Werte oder x / Varianz beobachtete Werte oder y

  • Vorgehen, um Determinationskoeffizient zu bestimmen
    1. Quadratsumme (beobachtete Werte) berechnen (Einzelne y Werte - Mittelwert y)
    2. Quadratsumme (vorhergesagte Werte) berechnen (Vorhersage der y Werte – Mittelwert y)
    a. Wenn es Regressionsgleichung gibt, können vorhergesagte Werte durch Einsetzen der x Werte berechnet werden
    3. Varianz (beobachtet) berechnen (Quadratsumme beobachtet durch VP Anzahl)
    4. Varianz (vorhergesagt) berechnen (Quadratsumme systematisch durch VP Anzahl)
    5. R2 = Varianz vorhergesagt / Varianz beobachtet
    6. Interpretation: 1 = Gesamtvarianz kann perfekt durch vorhergesagte Varianz erklärt werden

 Indeterminationskoeffizient 1-R2 = Anteil der unsystematischen Varianz an der Gesamtvarianz

38
Q
  1. Sonja (oder so) möchte testen, ob es einen Zusammenhang zwischen Gewicht (BMI-Wert, intervallskaliert) und sportlicher Aktivität (in Minuten pro Woche, intervallskaliert) bei Psychologie-Studierenden gibt. Welche Berechnung muss angewendet werden? Irgend eine Freundin von Sonja sagt aber, dass sowohl die Unterschiede im Gewicht als auch in der sportlichen Aktivität durch das Alter vorhergesagt werden können. Wie kann man das testen?
A

 Produkt-Moment-Korrelation

 Regressionsanalyse (?)

39
Q
  1. Irgendwer möchte den Zusammenhang zwischen zwei Variablen testen (Mögen von Statistik und Vorfreude auf das Empra, beides sei intervallskaliert). Es soll aufgrund der kleinen Anzahl der Versuchspersonen (n=4) keine Signifikanztestung durchgeführt werden. Es liegen Daten vor und es soll a) angegeben werden, wie der Zusammenhang berechnet werden kann, b) tatsächlich der Zusammenhang berechnet werden und c) angegeben werden, ob die Variablen zusammenhängen
A
  1. Irgendwer möchte den Zusammenhang zwischen zwei Variablen testen (Mögen von Statistik und Vorfreude auf das Empra, beides sei intervallskaliert). Es soll aufgrund der kleinen Anzahl der Versuchspersonen (n=4) keine Signifikanztestung durchgeführt werden. Es liegen Daten vor und es soll a) angegeben werden, wie der Zusammenhang berechnet werden kann, b) tatsächlich der Zusammenhang berechnet werden und c) angegeben werden, ob die Variablen zusammenhängen
40
Q
  1. Was ist Inferenzstatistik?
A

 Durch die Inferenzstatistik lassen sich allgemeine Schlussfolgerungen über umfassende Grundgesamtheiten durch Einbezug der Wahrscheinlichkeitstheorie schließen
 Es ist eine Statistik, die auf der Grundlage von Stichprobenergebnissen induktiv allgemein gültige Aussagen formuliert. Dazu zählen auch die Schätzung von Populationsparametern und die Überprüfung von Hypothesen.

41
Q

Definition Konfidenzintervall (+ wovon hängt die Breite ab)

A

 Auf Basis einer Stichprobe wird mit Hilfe eines Punktschätzers ein Wertebereich angegeben, der den echten Populationsparameter mit einer gewissen Wahrscheinlichkeit überdeckt.
 Je Breiter das Konfidenzintervall, desto unpräziser die Schätzung, desto kleiner jedoch Fehlerwahrscheinlichkeit
 Breite abhängig von
i. Standardabweichung (je größer Standardabweichung, desto größer KI)
ii. Signifikanzniveau (je kleiner Signifikanzniveau/Irrtumswahrscheinlichkeit, desto größer KI)
iii. Stichprobenumfang (je kleiner n desto größer KI)

42
Q

3. Was ist der Konfidenz-Koeffizient

A

 Auch Überdeckungswahrscheinlichkeit/Konfidenzlevel genannt, ist die Wahrscheinlichkeit, dass ein Intervall zu denjenigen zählt, die den echten Populationsparameter überdecken
 Eine Überdeckungswahrscheinlichkeit von 1-a=0.95 bedeutet, dass in 95 von 100 Fällen in denen ein KI aufgrund einer Zufallsstichprobe ermittelt wurde, der Populationsparameter innerhalb des Intervalls liegt

43
Q
  1. Was ist der Standardfehler? Was sagt er aus? -> großer oder kleiner Standardfehler gut?
A

 Der Standardfehler ist die Standardabweichung der Stichprobenkennwerteverteilung einer Statistik
 Maß dafür, wie stark die Statistik bei verschiedenen Erhebungen mit gleicher Stichprobengröße schwanken würde
 Er ist abhängig von der Standardabweichung des Merkmals und der Stichprobengröße
 Je kleiner der Standardfehler ist, desto genauer ist unsere Messung

44
Q
  1. Was ist Teststärke/Power?
A

 Die Teststärke bzw. Power ist die Wahrscheinlichkeit, einen Effekt aufzudecken, der auch wirklich da ist (1-ß)
 Also die Wahrscheinlichkeit, die H1 anzunehmen und diese auch wahr ist (Hohe Teststärke spricht gegen H0)
 Abhängig von
i. Größe der Stichprobe (je größer Stichprobe desto größer Power)
ii. Größe des Alpha-Fehlers (je größer Alpha desto kleiner Beta)
iii. Größe des Standardfehlers

H0 angenommen	H1 angenommen H0 wahr	 1-alpha	Alpha Fehler/ Fehler 1. Art H1 wahr	Beta Fehler / Fehler 2. Art	1-Beta
45
Q
  1. Warum und wie verändert sich die Teststärke bei größerer Stichprobe?
A

 Je größer der Stichprobenumfang n, desto kleiner der Standardfehler
 Der kritische Wert unter der H0 rückt mit zunehmender Stichprobengröße immer näher an den Populationswert unter der H0 heran
 -> Verringert die Irrtumswahrscheinlichkeit ß und erhöht die Teststärke.
 Mit steigender Stichprobengröße erhöht sich also die Wahrscheinlichkeit, einen postulierten Effekt zu finden.

46
Q
  1. Wie wirkt sich ein größerer Stichprobenumfang auf den Fehler 1. Art aus?
A

 Die Stichprobengröße hat keinen Einfluss auf den Fehler 1.Art, weil das a-Fehler-Niveau unabhängig davon festgelegt wird

47
Q
  1. Warum muss ein signifikanter Mittelwertsunterschied nicht zwangsläufig auch in der Population vorliegen?
A

 ein signifikanter Unterschied bedeutet nicht, dass er auch praktisch bedeutsam ist
 kann auch zufällig entstanden sein aufgrund der Schwankung  Fehler 1.Art!
 da das Konfidenzniveau nie 100% ist, kann es sein, dass man einen signifikanten Unterschied gefunden hat, der durch Zufall entstanden ist, trotz sehr geringer Wahrscheinlichkeit dafür
 Jeder statistische Test kann ein signifikantes Ergebnis produzieren, wenn die Stichprobe (und somit die Teststärke) nur groß genug ist. Bei großen Stichproben werden selbst kleine und praktisch unbedeutende Effekte signifikant.

48
Q
  1. Einfaktorielle ANOVA ohne Messwiederholung. Beispiel
A

 Beschäftigung in der Pause (3 Bedingungen) und die
 Ausprägung auf das aggressive Verhalten von Schülern (angegeben in einer Skala von 1-10).
 Gegeben waren 3 Zufallsmesswerte pro Bedingung.
 Formuliere die beiden Hypothesen
i. H0 = Beschäftigung in der Pause hat keine Auswirkung auf das aggressive Verhalten der Kinder
ii. H1 = Beschäftigung in der Pause hat einen Effekt auf das aggressive Verhalten der Schüler
 Berechne und formuliere am Ende einen Ergebnissatz
i. Die einfaktorielle ANOVA ergab, einen signifikanten Effekt der Pausenbeschäftigung auf die Aggressivität der Kinder, F &p-Wert
ii. Die Post Hoc Analyse ergab, dass der Unterschied in der Aggressivität zwischen Pausen-Beschäftigung 1 (Mittelwert & evtl. Standardabweichung) und Beschäftigung 2 (Mittelwert) signifikant ist (F – mit Freiheitsgraden & p), sowie der Unterschied zwischen Beschäftigung 1 und Beschäftigung 3 (F & p-Wert). Der Unterschied zwischen Beschäftigung 2 und 3 stellte sich jedoch als nicht signifikant heraus (f &p)
1. Evtl. noch Korrektur erwähnen

49
Q
  1. Partialkorrelation berechnen können
A

 Korrelation zwischen x & y, nachdem die z Variable herauspartialisiert wurde

 Wenn kleiner, als Korrelation davor (0. Ordnung), dann korreliert x mit y, wir aber durch Variable Z beeinflusst
 Wenn größer als Korrelation 0. Ordnung, unterdrück Variable z die Korrelation zwischen x & y (Suppressionseffekt)
 Wenn anderes Vorzeichen, dann dreht Variable z den Einfluss von y auf x um (negative Suppression)
 Keine Korrelation, Variable x korreliert nicht mit y, z ist Moderatorvariable

50
Q

Unterschied Korrelation, Regression, Varianzanalyse

A
  • Korrelation: Zusammenhang zwischen zwei/mehreren zufälligen Variablen
  • Regression: Vorhersagen der AV, anhand einer/mehrerer UV
  • Varianzanalyse: Analyse des Einflusses einer/mehrerer qualitativer Einflussgrößen auf eine Zielgröße zB Konsequenz des Verhaltens auf zeigen des Verhaltens -> Nominal & Ordinal
  • Regressionsanalyse: Analyse des Einflusses einer/mehrerer quantitativer Einflussgrößen auf eine Zielgröße zB Konsequenz des Verhaltens auf zeigen des Verhaltens -> Intervall, Verhältnis, Absolut
51
Q

Voraussetzungen ANOVA

A

Normalverteilte Variablen innerhalb der verschiedenen Populationen
Homoskedastizität (Varianzen der Variablen sind gleich) zB Durch Levene-Test
Unabhängige Gruppen
Unabhängige Beobachtungseinheiten

52
Q

ANOVA Vorgehen

A
  1. Hypothese
  2. Teststatistik Berechnen
    a. Quadratsummen

a) Man braucht Mittelwert der Faktorstufen & Gesamtmittelwert

a) Quadratsumme zwischen(Treatmentquadratsumme)
- Wie viel der totalen Unterschiedlichkeit komm durch unterschiedliche Treatments
b) Mittlere Quadratsumme zwischen (Relativierung an Freiheitsgraden)
- Dfzw = p-1

c) Quadratsumme innerhalb Berechnen (Fehlerquadratsumme)
- Wie viel der Totalen Unterschiedlichkeit nicht durch unterschiedliche Bedingungen erklärbar
d) Mittlere Quadratsumme innerhalb (Relativierung an Freiheitsgraden)
- Dfinn = n-p

a) Gesamtquadratsumme
- Wie ist die generelle Unterschiedlichkeit in den Daten
b) Mittlere Quadratsumme gesamt
- dftot= n-1b. Varianzanteile

c) Varianzanteile des Faktors (Determinationskoeffizient)
- Wie viel der Gesamtvarianz wird durch Faktor erklärt (Anteilig)
- R2 (zwischen durch total)
d) Des Fehlers
- 1-R2

 c.	Empirische Prüfgröße
MGQ zwischen / MQS inn
d.	Kritischen Wert ablesen
  = F0,05; p-1; n-p
e.	Ist empirischer Wert größer als kritischer Wert?
a)	Wenn ja = H0 verwerfen
b)	Wenn nein = H0 beibehalten
53
Q

2) Posthoc Analyse (Wodurch kommt Unterschiedlichkeit?)

A
  1. Vergleich von zwei Mittelwerten
    a. Least significant difference
  • LSD ist die Differenz, der mindestens zwischen zwei Mittelwerten liegen muss, damit sich zwei Bedingungen signifikant unterscheiden
    2. Vergleich von allen Mittelwerten
    a. Kontraste setzen
54
Q

Multiple lineare Regression Aufstellen - Vorgehen

A
  • Eine Ausprägung voraussagen anhand von mehreren Faktoren
  • Eine Zielgröße, mehrere Einflussgrößen

Erstellung des Regressionsmodells

  • Einfache Regression: y= b0 + b1 * xm + em
  • Multiple Regression: y= b0 + b1x1 + b2x2 + b3x3

Prädiktoren x (Gesamtanzahl = k) Vorausgesagt werden soll
Person i Körpergröße (x=1) Gewicht (x=2) Alter (x=3)
1 6 2 3
2 8 1 4
3 7 3 3
N=3
y = Ringgröße

  1. Berechnung der Parameter
    a. Standardisiert
    a) b1s = über korrelation der einzelnen Faktoren
    b) bs2 = …
    c) B0s = 0
    b. Unstandardisiert
    a) b1 = standardisiertes b1* standardabweichung y &x1
    b) b2 = -//- x2
    c) b0 = My - b1 * Mx1 - b2 * Mx2
  2. Interpretation der Parameter
    a. zB b1=0,5 -> Person, die um eins in Körpergröße größer ist, hat eine Ringgröße, die durchschnittlich um 0,5 größer ist
    b. b2= -0,4 -> Person, die um eins in Gewicht schwerer ist, hat eine Ringgröße, die durchschnittlich um 0,4 kleiner ist
  3. Varianzzerlegung
    a. R = Korrelation zwischen y & y^ (also zwischen den beobachteten Werten & vorhergesagten Werten)
    b. R2 = Korrelation2
    a) Wie viel Varianz der beobachteten Werte kann durch alle Prädiktoren erklärt werden
55
Q

Signifikanztest des Regressionsmodells

A

a) Entweder Signifikanztest des gesamten Modells
c. F alpha;k;n-k-1
d. k = Anzahl Prädiktoren

b) Signifikanztest für einen der Prädiktoren

e. Standardfehler des Regressionsgewicht in Tabelle ablesbar
f. Talpha;n-k-1

56
Q

Einfache lineare Regressionsgleichung Erstellen - Vorgehen

A
	Regressionsgleichung y= b0 + b1 * xm + em
	Standardisiert
-	Berechnen Korrelation
-	Einsetzen Korrelation für b1s
-	B0s =0
	Unstandardisiert
-	Berechnen Korrelation
-	Berechnen von b1 = r* (sy/sx)
-	Berechnen von b0 = Mittelwerty – b1*Mittelwertx