Einfuehrung in die Methodenlehre Flashcards
Was zeichnet Alltagspsychologie aus?
- erlernt aus Erfahrung
- setzt keine Kenntnisse der Psychologie voraus
- jeder hat eine Alltagspsychologie
- wird in der Regel nicht hinterfragt
- besteht meist aus unbewiesenen Annahmen/Behauptungen
- Behauptungen werden nicht methodisch und systematisch kontrolliert
Was sind Unterschiede zwischen wissenschaftlicher und Alltagspsychologie?
Wissenschaftliche Psychologie verwendet gezielte Strategien, untersucht den Wahrheitsgehalt von Behauptungen systematisch, neutralisiert Fehlerquellen
Aus welchen Gründen wird Alltagspsychologie oft als gültig angesehen?
- wenn eine Annahme falsch ist, kann sie trotzdem eintreten
- falsche Annahmen sind irrelevant
- Annahmen beeinflussen unser Handeln
- Annahmen verzerren Wahrnehmung und Erinnerung
Was sind die Ziele der wissenschaftlichen Psychologie?
1) Sammlung von Tatsachenwissen
2) Erforschung von Gesetzmäßigkeiten
3) Hypothesenbildung = Beschreibung der vermuteten Gesetzmäßigkeiten
Wodurch entstehen Hypothesen?
- durch intensive Beschäftigung mit dem Thema
- gute Beschreibung des Problems
- Diskussion von Fragestellungen
- Explorationsstudien
Was ist eine explorative Analyse und was ist ihr Gegenteil?
In einer explorativen Analyse stößt man zufällig auf etwas, in einer konfirmatorischen Analyse möchte man etwas bestätigen
Welche Methoden sind für die Überprüfung von Hypothesen akzeptabel, welche nicht?
Akzeptabel: mit Wirklichkeit vergleichen und logische Zusammenhänge berücksichtigen Nicht akzeptabel: subjektive Überzeugung, Berufung auf Autoritäten, Nachweis durch Beispiele
In welchen fünf Schritten erfolgt die Überprüfung einer Hypothese?
1) Hypothese formulieren
2) empirische Vorhersage
3) Realisierung des Experiments
4) Vergleich von Vorhersage und Wirklichkeit
5) Ergebnis/Fazit
Nennen Sie Eigenschaften einer empirischen Vorhersage!
- sie entsteht aus der Hypothese, zusätzliche Annahmen und Wissen einbezogen
- sagt, dass unter bestimmten Bedingungen ein spezielles empirisches Ereignis eintritt
- dieses Ereignis kann vergangen oder zukünftig sein
- die Vorhersage bezieht sich auf die Kenntnis des Ereignisses
Worin unterscheiden sich experimentelle und nicht experimentelle Forschung?
Experimentelle Forschung: Bedingungen werden von Versuchsleiter erzeugt
nicht experimentell: beobachtet nur, ob die Bedingungen erfüllt werden
Was bedeutet es, dass isolierte Hypothesenprüfung nicht möglich ist?
Dass es zu den explizit genannten Bedingungen außerdem noch unausgesprochene gibt. Die Prüfung einer Hypothese erfolgt immer relativ zu gewissen Zusatzannahmen (die im Zweifelsfall zu prüfen sind).
Welche Typen von Hypothesen gibt es (bzgl. ihrer Anwendungsbreite)?
- universelle Hypothesen: für alle Falle
- existenzielle Hypothesen: für mindestens einen Fall
- Hypothesen über Anteile: für Anteile aller möglichen Fälle
Wann gilt eine Hypothese als veri-, wann als falsifiziert?
- verifiziert, wenn sie als wahr bewiesen wurde
- falsifiziert, wenn als falsch bewiesen
Wovon ist die Veri- und Falsifizierbarkeit einer Hypothese abhängig?
- vom Typ der Hypothese
- vom Bereich der Fälle, für den sie formuliert ist
Ist eine universelle Hypothese veri- oder falsifizierbar, wenn alle Fälle der Grundgesamtheit untersucht werden?
verifizierbar und falsifizierbar
Ist eine universelle Hypothese veri- oder falsifizierbar, wenn nicht alle Fälle der Grundgesamtheit untersucht werden?
nur falsifizierbar
Ist eine existenzielle Hypothese veri- oder falsifizierbar, wenn alle Fälle der Grundgesamtheit untersucht werden?
verifizierbar und falsifizierbar
Ist eine existenzielle Hypothese veri- oder falsifizierbar, wenn nicht alle Fälle der Grundgesamtheit untersucht werden?
nur verifizierbar
Ist eine Hypothese über Anteile veri- oder falsifizierbar, wenn alle Fälle der Grundgesamtheit untersucht werden?
verifizierbar und falsifizierbar
Ist eine Hypothese über Anteile veri- oder falsifizierbar, wenn nicht alle Fälle der Grundgesamtheit untersucht werden?
nicht verifizierbar und nicht falsifizierbar
Was ist eine bestätigte/bewährte Hypothese?
eine universelle Hypothese, die nicht falsifiziert wurde
Was sind Voraussetzungen der Überprüfbarkeit von Hypothesen?
- widerspruchsfrei
- kritisierbar
- operationalisierbar
- Reihenfolge (erst formulieren, dann überprüfen)
Was sind Qualitätskriterien einer Hypothese?
- ihr empirischer Gehalt
- strenge Prüfung
Was bezeichnet man als empirischen Gehalt einer Hypothese?
wie informativ sie ist
Was ist der Unterschied zwischen experimenteller und nicht experimenteller Forschung?
experimentell: Versuchsleiter greift aktiv und gezielt ein
nicht experimentell: beobachten ohne einzugreifen
Was sind Voraussetzungen für ein erfolgreiches Experiment / Eigenschaften eines erfolgreichen Experiments?
- systematische Variation von mindestens einer unabhängigen Variablen
- Aufzeichnen des Effekts dieser Variation
- Ausschalten von Störvariablen
Was ist der Vorteil von Experimenten gegenüber nicht experimenteller Forschung?
man kann das Ursache-Wirkungs-Prinzip untersuchen
Warum ist die nicht experimentelle Forschung in der Psychologie ebenfalls wichtig?
da bei vielen Fragestellungen ein aktives Eingreifen nicht möglich ist
Definieren Sie “Variable”!
- ein beliebiges Merkmal eines Menschen/Objekts mit mindestens zwei Ausprägungen
- bei einem konkreten Menschen/Objekt trifft jeweils nur eine Ausprägung zu
Was kennzeichnet eine qualitative Variable?
Sie hat zwei Abstufungen, das ist Nominalniveau
Nennen Sie drei Typen von Variablen (in der experimentellen Forschung)!
1) UV = unabhängige Variable
2) AV = abhängige Variable
3) Störvariable
Nennen Sie Synonyme für die unabhängige Variable!
UV, independant variable, Faktor/factor, Prädiktor/predictor, Behandlung/treatment
Nennen Sie Synonyme für die abhängige Variable!
AV, dependent variable, Kriteriumsvariable / outcome variable
Was unterscheidet die abhängige von der unabhängigen Variable?
Die unabhängige Variable beeinflusst der Versuchsleiter aktiv; die abhängige Variable dient der Beobachtung des Effekts der UV
Was bedeutet es, eine Störvariable zu kontrollieren?
Man schaltet ihre Wirkung aus, indem man ihren Wert konstant hält bzw. indem man mehrere Stufen der Störvariablen zufällig mit den Stufen der UV kombiniert
Was ist eine Moderatorvariable?
Das ist eine Variable, von der abhängt, wie der Effekt einer Variable A auf eine Variable B ausfällt. D.h., ein Moderator beeinflusst den Zusammenhang zwischen zwei Variablen. Er ist das Merkmal einer Person/Situation, von dem die Gültigkeit einer Hypothese abhängt.
Was ist eine Mediatorvariable?
Das ist eine Variable, die den statistischen Zusammenhang zwischen zwei Variablen vermittelt.
Bsp.: WENN x >> y UND z >> y DANN x >> z >> y In diesem Beispiel ist z ein Mediator, weil der Zusammenhang x-y auf der Veränderung von z beruht.
Welche Arten von Experimenten gibt es hinsichtlich ihres Ziels?
- Prüfexperimente: prüfen Hypothesen
- Erkundungsexperimente / Pilotstudien: wollen neue Hypothesen bilden, sammeln oft Daten ohne vorherige Hypothese
- Vorexperiment: um ein Experiment zu proben und zu verbessern
Welche Arten von Experimenten gibt es hinsichtlich der Anzahl ihrer Variablen?
- eine UV: unifaktoriell (einfaktoriell)
- mehrere UV: multifaktoriell (mehrfaktoriell)
- eine AV: univariat
- mehrere AV: multivariat
Was sind Vor- und Nachteile von Feldstudien?
- meist nicht experimentell
- Störvariablen schwerer kontrollierbar
- UV und AV oft schwerer zu operationalisieren
- eingeschränkt generalisierbar (wegen der Störvariablen)
+ Ergebnisse lassen sich für natürliche Situationen direkt verwerten
Was sind Vor- und Nachteile von Laborstudien?
+ spezieller Untersuchungsraum bietet bessere Kontrolle über Störvariablen
- schwerer generalisierbar >> nur dann, wenn man die kritischen Variablen der natürlichen Situation mit einbezieht
Was sind Vor- und Nachteile von Internetstudien?
- Selbstselektion (weniger ältere Vpn, Unterschied Teilnehmer/Nicht-Teilnehmer)
- Angaben der Vpn kann man nicht überprüfen
- Störvariablen nicht kontrollierbar
- vorzeitiger Abbruch leicht möglich
+ gesamter Ablauf ist programmiert, also genormt
+ einfache Teilnahme >> mehr Vpn
+ Vp bestimmt Durchführungszeitpunkt selbst
Welche Phasen/Stufen umfasst der Forschungsprozess?
1) Fragestellung
2) Hypothesen
3) Operationalisieren
4) Versuchsplan
5) Kontrolle der Störvariablen
6) Stichprobe
7) empirische Vorhersage und statistische Hypothese
8) Durchführung
9) Auswertung der Daten
10) Schluss auf die Sachhypothese
11) Diskussion
12) Bericht
Wozu ist Operationalisierung nötig?
Hypothesen beinhalten Begriffe, diese sind nicht direkt beobachtbar >> Zuordnen von beobachtbaren Phänomen zu Begriffen = Operationalisieren
Was ist Konstruktvalidität und wovon hängt sie ab?
Das ist die Güte der Operationalisierung. Variablen sind mehr oder weniger beobachtungsnah und Begriffe lassen sich mehr oder weniger direkt operationalisieren. Je abstrakter der Begriff, desto indirekter die Operationalisierung; je indirekter die Operationalisierung, desto detaillierteres Hintergrundwissen ist nötig
Nennen Sie vier Methoden der Datengewinnung!
- Verhaltensbeobachtung
- Analyse von Verhaltensspuren
- Test
- Befragung
Definieren Sie “Messen”!
Messen = Skalieren = Zuordnen von Zahlen zu Objekten
Was sind Skalenwerte?
Das sind zugeordnete Zahlen (beim Messen). Sie repräsentieren Relationen zwischen Messobjekten.
Welche vier Probleme gibt es beim Messen und worin bestehen sie?
- Repräsentationsproblem: ist eine bestimmte Variable überhaupt messbar?
- Eindeutigkeitsproblem: welche Freiheit hat man bei der Zuordnung der Skalenwerte?
- Bedeutsamkeitsproblem: ein Skalenwert ist bedeutsam, wenn sein Wahrheitswert bei allen zulässigen Transformationen gleich bleibt
- Skalierungsproblem: die Messung muss valide und reliabel sein
Was bezeichnet man als abhängiges Design?
= Messwiederholungsdesign = Wenn Messsubjekte in ihren Versuchsbedingungen mind. 2 Mal gemessen werden
Was sind Experimental- und Kontrollgruppe?
Experimentalgruppe: die Gruppe, bei der jene Stufe der UV realisiert wird, die den Versuchsleiter interessiert.
Kontrollgruppe: ermöglicht Vergleich, kontrolliert Störvariablen
Welche Arten von Störvariablen gibt es? Nennen Sie Beispiele!
- Störvariablen bei der Person: Alter, Intelligenz, Emotionalität
- Störvariablen bei der Untersuchungssituation: Umgebung, Zeit, Reihenfolge der Aufgaben
Zählen Sie Kontrollmechanismen gegen Störvariablen auf!
bzgl. Person:
- Parallelisieren/Matching
- Randomisieren
bzgl. Untersuchungssituation:
- Elimination
- Konstanthalten
- Kontrollgruppe
- Zufallsvariation
Was bedeutet “Parallelisieren”?
Das ist eine Methode zur Kontrolle von Störvariablen. Zuerst misst/erhebt man die Störvariable. Dann werden die Vpn gleichmäßig den Gruppen zugeteilt, sodass der Durchschnitt der Störvariablen in beiden Gruppen gleich ist.
Was bedeutet “Randomisieren”? Nennen Sie Vor- und Nachteile!
= Zufälliges Zuordnen zu Gruppen: durch Lose, Münzwurf oder Zufallszahlen
Pro: Störvariable muss nicht bekannt sein, nicht operationalisiert oder gemessen werden.
Contra: Trotz Zufalls können ungleiche Gruppen entstehen; problematisch v.a. bei kleinen Gruppen
Was bedeutet “Elimination”?
= Neutralisieren der Störvariable (falls möglich).
Was bedeutet “Konstanthalten”? Nennen Sie einen Nachteil!
= Gleiche Bedingung für alle Vpn.
- Das heißt aber nicht, dass die Störvariable bei allen Vpn gleich wirkt.
- Nachteil: eventuell nicht generalisierbar
Wozu dient eine Kontrollgruppe?
Sie kontrolliert Veränderungen und Einflüsse zwischen Messzeitpunkten.
Sie kontrolliert den reaktiven Effekt der Vorhermessung = bei der Vorhermessung könnte es zu priming/Einstellungsänderung kommen
Was bedeutet “Konfundierung”?
= systematische Variation der UV und einer Störvariable
>> ein Ergebnis lässt sich dann nicht auf die Wirkung der UV zurückführen Kontrolle durch Zufallsvariation
Was ist eine Stichprobe?
= Teilmenge einer Grundgesamtheit/Population
Welche Typen von Stichproben gibt es?
- Zufallsstichprobe
- Klumpenstichprobe (Teilmenge, die natürlich vorliegt und vollständig erhoben wird, z.B. alle Schüler einiger zufälliger Schulen)
- Geschichtete Stichprobe (man teilt die Gesamtpopulation nach relevanten Merkmalen in nicht überlappende Teile; aus jeder Schicht kommt eine Zufallsstichprobe, diese werden zusammengeführt)
- Verhaltensstichprobe: bedeutet, dass man nur einen Ausschnitt des interessierenden Verhaltens beobachten kann (z.B. Erziehung nicht 24/7, sondern nur für gewisse Zeitabschnitte)
Nennen Sie Eigenschaften einer Zufallsstichprobe!
- jedes Element der Population hat die gleiche Chance auf Aufnahme in die Stichprobe
- Ziehung bedeutet oft hohen Aufwand
- zufälliges Zuordnen alleine macht noch keine Zufallsstichprobe aus! z.B. Ad-hoc-Stichproben mit zufällig anwesenden Studenten >> weniger gut generalisierbar
Was ist ein Bias in der Stichprobe?
= systematische Verzerrung durch Fehler im Auswahlverfahren
Was unterscheidet Sachhypothese und empirische Vorhersage?
Eine Sachhypothese hat typischerweise die Form: “Wenn …, dann …”. Aus ihr lässt sich die empirische Vorhersage entwickeln (z.B.: “In der Experimentalgruppe passiert …, in der Kontrollgruppe passiert …”).
Nennen Sie zwei Arten von statistischen Hypothesen!
Null- und Alternativhypothese
Was unterscheidet Null- und Alternativhypothese?
Nullhypothese = H0 = Die bei einer Hypothesenprüfung zu testende Annahme über die Grundgesamtheit (häufig diejenige Hypothese, die man widerlegen möchte).
Beinhaltet immer Gleichheit von Sachverhalten (auch ≤ und ≥).
Alternativhypothese = Arbeitshypothese = HA = Eine (durch Beobachtung oder Überlegung) begründete Annahme, die bestimmte Phänomene erklärt und die einer möglicherweise verbreiteten Annahme entgegensteht.
Beinhaltet immer Ungleichheit von Sachverhalten.
Welche Punkte sollte man bei der Durchführung eines Experiments beachten?
- Ablauf
- Räumlichkeiten
- Geräte und Hilfsmittel
- Umgang mit Vpn
- Instruktionen
- Standardisierung der Bedingungen
- Probelauf
- Ergebnis
- Bericht
Woran sollte man beim Ablauf eines Experiments denken?
- Wie beginnt es?
- Einzel- oder Gruppenversuch?
- zeitlicher Ablauf?
Was sind Vor- und Nachteile von Einzel- und Gruppenversuchen?
- keine Beeinflussung durch andere Vpn vs. gegenseitige Beeinflussung
- persönliche Betreuung vs. keine individuelle Anpassung
- aufwendiger vs. ökonomischer
- meist versch. Tageszeiten vs. gleiche Uhrzeit/Tageszeit
Wie sollte man mit Versuchspersonen umgehen?
- Vpn sind Datenquelle und Grundlage!
- sollen sich wohlfühlen
- keine Angst, Unkenntnis, Unsicherheit (sind Störvariablen)
- kompetenter Versuchsleiter
- keine falschen Hoffnungen wecken
- Ablauf und Technologien erläutern
- Anonymität betonen
- Vpn soll Hypothese nicht schon vorher erraten
- sicherstellen, dass Vpn freiwillig teilnimmt
- Vpn nicht unter Druck setzen
- Diplomarbeiten als wissenschaftliche Studie verkaufen, dann mehr Motivation
- Begrüßung, dann Einhaltung von Versprechen (Geld o.ä.), dann Verabschiedung
- Vpn über Dauer informieren
Was ist bzgl. Räumlichkeiten beim Experiment zu beachten?
- möglichst störungsfrei und standardisiert - dies gilt für Labor - Nachteil Labor: Anreise der Vpn, unpersönlich, abschreckende Geräte, kein natürliches Umfeld
Was ist wichtig bei der Verwendung von Hilfsmitteln während eines Experiments?
- vor Beginn alles prüfen
- Vorbereitungen für Ausfall
- regelmäßige Wartung
- Reinigung
- schonender Umgang
- (anonyme) Datensicherung gewährleisten
- Einschulung der Versuchsleiter
Unter welchen Voraussetzungen kann man auf die Sachhypothese schließen?
- Operationalisierung ist stimmig
- Versuchsplan ist angemessen
- Störvariablen sind neutralisiert
- Stichprobe ist korrekt gewählt
- fachliches/methodisches Wissen ist korrekt eingesetzt
- statistisches Prüfverfahren ist richtig gewählt und angewandt
Nennen und erläutern Sie kurz die Gütekriterien eines Experiments!
- interne Validität: ließen sich die Störvariablen kontrollieren?
- externe Validität: lassen sich die Ergebnisse verallgemeinern?
- Konstruktvalidität: ist die Operationalisierung gelungen?
- Validität statistischer Schlussfolgerung: ist die Anwendung statistischer Verfahren gerechtfertigt?
Welche Punkte sollte ein Bericht jedenfalls enthalten?
- Einleitung
- Methoden: Versuchspersonen, Apparate und Materialien, Versuchsplan, Durchführung
- Ergebnisse
- Diskussion
- Zusammenfassung
- Ausblick
- Literaturverzeichnis
Was ist ein 2x2x2-Plan?
Ein Versuchsplan mit 3 UV, wobei jede UV 2 Stufen hat.
Nennen und erklären Sie drei Arten von Versuchsplänen!
- CRF = Completely Randomized Factorial: für Gruppen, alle UV werden miteinander kombiniert - RBF = Randomized Block Factorial: für Messwiederholungen - SPF = Split Plot Factorial: für Gruppen und Messwiederholungen; nicht komplett randomisiert, gemischte
Was bedeutet RBF23?
Ein Versuchsplan im Randomized Block Factorial Design mit zwei UV, eine hat 2, eine hat 3 Stufen
Was bedeutet SPF23.22?
Split Plot Factorial: ein Versuchsplan mit 2 Messwiederholungsfaktoren (mit 2 und 3 Stufen) und 2 Gruppenfaktoren (mit je 2 Stufen)
Was sind Hypothesen über Haupteffekte?
Das sind Hypothesen über jede der UV (über deren Wirkung)
Was ermöglichen mehrfaktorielle im Gegensatz zu einfaktoriellen Versuchsplänen?
Man kann die Interaktion zwischen mind. 2 Faktoren prüfen
Was ist ein Versuchsplan mit Messwiederholung?
= within-subject-design: die Vpn unterliegen mehr als einer experimentellen Bedingung
Was ist der Positionseffekt?
= Stellungseffekt: eine Störvariable aufgrund der Position einer Bedingung in einer Reihenfolge (an welcher Stelle kommt die Bedingung?, z.B. priming möglich)
Was ist der Carry-Over-Effekt?
= Übertragungseffekt: eine frühere experimentelle Bedingung hat inhaltlichen Einfluss auf eine spätere (z.B. die erste Aufgabe erklärt die zweite)
Nennen Sie Möglichkeiten zur Kontrolle von Positionseffekten!
- Ausbalancieren
- Unvollständiges Ausbalancieren
Wie funktioniert das Ausbalancieren zur Kontrolle von Positionseffekten?
Man erzeugt alle möglichen Reihenfolgen der Bedingungen und teilt die Vpn auf - bei n Bedingungen gibt es n! Reihenfolgen
Wie funktioniert unvollständiges Ausbalancieren?
- man verwendet nur einen Teil aller möglichen Reihenfolgen - das funktioniert v.a. mit vielen Vpn Die Kontrolle passiert via: - Zufallswahl: für k Vpn wählt man k Reihenfolgen aus und verteilt die Vpn zufällig - Spiegelbildmethode: man wählt eine Reihenf
Wie kann man Carry-Over-Effekte kontrollieren?
- Methoden gegen Positionseffekte nicht anwendbar - andere Reihenfolge oder Bedingungen umgestalten (aber Hypothese nicht beeinflussen) - Rückkehr zu Experiment mit nur einer Bedingung je Vpn - falls nicht anders möglich, sollte viel Zeit zwischen den Bed
Was ist der Versuchsleitereffekt?
= Rosenthal-Effekt = Versuchsleiterartefakt = selbsterfüllende Prophezeiung: der Versuchsleiter beeinflusst unabsichtlich die Vpn, oft nonverbal
Was ist die Basis für den Erwartungseffekt (Versuchsleitereffekt)?
- der Versuchsleiter kann für jede Vpn eine Erwartung bilden
- diese Erwartung drückt sich in Verhalten aus
- die Vpn interpretieren das Verhalten korrekt
- die Vpn lassen sich beeinflussen
Wie kann man den Versuchsleitereffekt kontrollieren?
- Standardisierung der Bedingungen
- Training des Versuchsleiters (nonverbales Verhalten) - Manipulation der Erwartung des Versuchsleiters (zusätzlicher Versuchsleiter, Erwartungskontrollgruppe)
- Blind- und Doppelblindversuch
- Ausschalten des Versuchsleiters
Was kennzeichnet den Versuchspersoneneffekt?
Die Erwartungen der Vpn: - Erwartungen, wie die Bedingung wirkt - aufgrund von Aufforderungsvariablen (Instruktion) - durch soziale Erwünschheit Motive der Vpn: - Teilnahme oder nicht (Geld? Freiwillig?) - Kooperation oder nicht - Testangst, Bewertungsangst - Bedürfnis nach sozialer Anerkennung
Was ist ein Quasi-Experiment?
- Eine Untersuchung, bei der nicht alle Störvariablen kontrollierbar sind - Kontrolle der UV, aber nicht der AV - zufälliges Zuordnen zu Gruppen nicht möglich - keine Kausalzusammenhänge wegen fehlender Kontrolle der Störvariablen - Schließen von AV auf
Nennen Sie drei Typen von Quasi-Experimenten!
- Versuchsplan mit nichtäquivalenter Kontrollgruppe: keine Kontrollgruppe oder Gruppen sind nicht randomisiert
- Zeitreihenversuchsplan (man misst die AV zu mehr als zwei Zeitpunkten)
- Einzelfallversuchsplan mit Reversion: z.B. ABAB-Plan, wobei A= Abwesenheit der Behandlung und B = Behandlung; oft in klinischer Psychologie
Zählen Sie die Skalierungsniveaus geordnet auf und geben Sie Beispiele!
Kategorial:
- binär: nur 2 Kategorien (z.B.: ja/nein, wahr/falsch)
- nominal: mehrere Kategorien (z.B.: Franzose, Deutscher, Ire, …)
- ordinal: wie nominal, aber mit logischer Ordnung (z.B.: “Sehr gut” bis “Nicht genügend”)
Kontinuierlich:
- Intervall: wie ordinal, aber die Abstände sind messbar, besitzt keinen natürlichen Nullpunkt (z.B.: IQ von 90 vs. 95, gleicher Abstand wie 100 vs. 105)
- ratioskaliert: wie Intervall, aber die Verhältnisse sind darstellbar, besitzt natürlichen Nullpunkt (z.B.: 5 Millimeter vs. 10 Millimeter, ist doppelt so lang)
Welchem Skalierungsniveau entspricht der IQ?
Intervallskala
Welchem Skalierungsniveau entspricht eine Länge in mm?
Ratioskala
Welchem Skalierungsniveau entsprechen Schulnoten?
Ordinalskala
Wozu dienen Histogramme und wie werden sie beschriftet?
Sie zeigen Häufigkeitsverteilungen; wie oft man einen bestimmten Messwert in den Daten beobachtet. Auf der x-Achse: Werte/Kategorien der Messung. auf der y-Achse: Anzahl der Beobachtungen
Welche Eigenschaften besitzt eine Normalverteilung?
- symmetrisch
- glockenförmig
- unimodal
- f(-x) = f(+x)
Nennen Sie zwei Eigenschaften, um Häufigkeitsverteilungen zu beschreiben!
- Schiefe/Skew
- Kurtosis/Breite/Wölbung
Was ist die Schiefe einer Häufigkeitsverteilung?
= Skew: Schiefe hinsichtlich der Symmetrie der Verteilung
Was bezeichnet man als “positive skew”?
positive skew = positive Schiefe = linkssteil = rechtsschief: Ansammlung von Werten im niederen Bereich, Ausläufer bei den höheren Werten
Was bezeichnet man als “negative skew”?
negative skew = negative Schiefe = rechtssteil = linksschief: Ansammlung von Werten im hohen Bereich, Ausläufer bei den niederen Werten
Was ist die Kurtosis einer Häufigkeitsverteilung?
Kurtosis = Breite = Wölbung: das Gewicht der Kurve / heaviness of the tails
Wie nennt man eine Häufigkeitsverteilung mit schweren Ausläufern (heavy tails)?
= steilgipfelig = supergaußförmig = leptokurtisch
Wie nennt man eine Häufigkeitsverteilung mit leichten Ausläufern (light tails)?
= flachgipfelig = subgaußförmig = platykurtisch
Womit berechnet man das Ausmaß der Schiefe?
mit v(X)
Womit berechnet man das Ausmaß der Kurtosis/Wölbung?
mit dem Exzess γ
Was besagt der Exzess γ?
wie steil/breit die Verteilung ist
γ = 0 … Normalverteilung, mesokurtisch
γ > 0 … steilgipfelig
γ < 0 … flachgipfelig
Mit welchen Eigenschaften kann eine Verteilung beschrieben werden?
- explizit durch eine Funktion - durch ihre zentralen Kennwerte: Mittelwert, Modus, Median - durch ihre Streuung/Dispersion: Range, Quantile, Varianz, Streuung
Beschreiben Sie den Mode!
Mode = Modus = der häufigste vorkommende Wert zwei Modes = bimodal mehrere Modes = multimodal
Beschreiben Sie das arithmetische Mittel!
= Gleichgewichtspunkt der Daten = Summe der Daten dividiert durch Anzahl der Daten
Beschreiben Sie den Median!
jener Wert, der eine Verteilung in zwei Teile teilt
Was ist der Range?
die Differenz zwischen kleinstem und größtem Wert; im Falle von Ausreißern stark verzerrt
Was sind Quartile?
jene drei Werte, die eine Verteilung in vier gleiche Teile trennen (Q₁, Q₂, Q₃)
Q₂ = ?
zweites Quartil = Median
Q₁ = ?
unteres Quartil = Median der unteren Datenhälfte
Q₃ = ?
oberes Quartil = Median der oberen Datenhälfte
Was ist der Interquartilsbereich?
der Bereich zwischen unterem und oberem Quartil
Was ist ein Perzentil/Prozentrang?
Perzentil = Prozentrang: ist ein Punkt, unter dem x% aller Fälle der Verteilung liegen Quantil .x = Perzentil x die Intervalle der Perzentile überlappen sich nicht
Was sind Quantile?
Werte, die Datensets in gleiche Teile aufteilen
Wie viele Wahrscheinlichkeitsverteilungen gibt es?
unendlich viele
Beschreiben Sie die Varianz!
Sie kennzeichnet am besten die Variabilität der Messwerte von symmetrisch verteilten Merkmalen Merkmal = erhobene Größe/Variable
Warum wird in der Varianzformel quadriert?
um große Abweichungen stärker zu betonen
Was ist der Nachteil der Varianz?
die Interpretation, wegen der quadrierten Einheiten
Beschreiben Sie die Standardabweichung!
= die Quadratwurzel der Varianz
- kann als repräsentative Abweichung vom Zentrum interpretiert werden
- hat die gleiche Einheit wie die Messwerte
Wozu dienen z-Werte?
um Werte zu standardisieren (nicht jede Verteilung hat µ = 0 und ? = 1, aber man kann sie in eine solche überführen! Statt des eigentlichen Werts nimmt man dann den z-Wert und kann in der Tabelle eine Wahrscheinlichkeit ermitteln. s. Andy Field, S. 31f.)
Nennen Sie Eigenschaften von z-Werten!
- sie standardisieren Werte (weil sie auch die Streuung berücksichtigen) - sie stellen einen Wert als Vielfaches der Standardabweichung dar - sie haben einen Mittelwert von 0 - sie haben eine Standardabweichung von 1 - bei Standardnormalverteilung N (µ,
Was bedeutet ein z-Wert von 0?
z ist im Zentrum der Verteilung, z teilt die Fläche unter der Kurve in exakt zwei Hälften; beide Bereiche haben eine Fläche von .5 = 50% (s. Field, S. 32)
Welcher z-Wert schneidet die oberen 2,5% einer Verteilung ab?
z = 1,96 (s. Field, S. 32)
Welcher z-Wert schneidet die unteren 2,5% einer Verteilung ab?
z = -1,96 (Minus, da links von der Mitte) (s. Field, S. 32)
Wie viel % der z-Werte liegen zwischen -2,58 und 2,58?
99%
Wie viel % der z-Werte liegen zwischen -3,29 und 3,29?
99,90%
Wie findet man den z-Wert, unterhalb dessen sich x% der Verteilung befinden?
Man rechnet 100-x% = y% und sieht y bei “% in Tail” nach (s. Folie S. 23)
Mit z-Tabelle: Ein Intelligenztest bei der Person X ergab einen IQ = 93. Der Populationsmittelwert sowie die Streuung dieses Tests sind bekannt mit µ = 100 und σ = 10. Wie viel % der Bevölkerung erreichen wahrscheinlich einen höheren IQ bei diesem Test?
z = (Xi - µ)/s z = (93-100)/10 z = -0,7
z-Wert 0.70 = 24,20
aber der z-Wert ist negativ, daher:
100-24,20 = 75,80%
>> 75,80% der Bevölkerung erreichen wahrscheinlich einen höheren IQ.
Unter welchen Voraussetzungen ist die Schätzung der Populationsvarianz hinreichend genau?
- Stichprobengröße n > 30 - Stichprobenvarianz unterschätzt Populationsvarianz, daher Korrektur
Was besagt der zentrale Grenzwertsatz / das zentrale Grenzwerttheorem?
Wenn n > 30, dann geht die Verteilung von Mittelwerten gleich großer Stichproben aus derselben Population in eine Normalverteilung über
Was ist der Standardfehler?
Standardfehler = standard error = SE: ist die Standardabweichung einer Stichprobenverteilung (z.B. des Mittelwerts) (s. Field, S. 54)
Wann verwendet man griechische, wann lateinische Buchstaben für Kennwerte?
- griechische mit Bezug auf die Population
- lateinische mit Bezug auf die Stichprobe
Wie kennzeichnet man geschätzte Kennwerte?
mit einem Zirkonflex über dem Buchstaben
Was ist “µ quer Dach”?
der geschätzte Mittelwert der Population
Was ist s²?
die Varianz der Stichprobe
Was ist ein Erwartungswert?
- jener Wert einer Zufallsvariable, der sich (meist) bei oftmaliger Wiederholung des Experiments als Mittelwert der Ergebnisse ergibt. - bestimmt die Lokalisation/Lage einer Verteilung - muss kein mögliches Ergebnis des zugrunde liegenden Zufallsexperime
Mit welchem Wert in der deskriptiven Statistik lässt sich der Erwartungswert vergleichen?
Mit dem empirischen arithmetischen Mittel einer Häufigkeitsverteilung
Was macht das Gesetz der großen Zahlen?
sichert oftmals, dass der Stichprobenmittelwert bei wachsender Stichprobengröße gegen den Erwartungswert konvergiert (je größer N, desto genauer “x quer”)
Definieren Sie den Erwartungswert einer Stichprobenvarianz!
E(S²) = Populationsvarianz (?²) minus Varianz der Mittelwerte
Worin unterscheidet sich die Formel zur Erwartungstreue der Stichprobenvarianz von der Populationsvarianz?
durch den Faktor (n-1)/n d.h.: E(S²) = ?² * (n-1)/n
Was bezeichnen Hn und hn? Wie hängen sie zusammen?
Hn = absolute Häufigkeiten hn = relative Häufigkeiten hn(S) = Hn(S)/n
Was besagt die “grundlegendste Formel der Statistik”?
Ergebnis i = Modell + Fehler i - Modelle bilden die Wirklichkeit ab, sind aber nicht perfekt - der Fehler des Mittelwerts lässt sich gut mit der Standardabweichung beschreiben - Vergleicht man Modell und Wirklichkeit, ist der Standardfehler ein guter Kennwert. Er zeigt, wie gut eine Stichprobe eine Population repräsentiert.
Wie viel % der Werte liegen in einer Normalverteilung zwischen µ+σ und µ-σ?
68,27%
Wie viel % der Werte liegen in einer Normalverteilung zwischen µ+2σ und µ-2σ?
95,45%
Was ist der Konfidenzkoeffizient?
~ die Wahrscheinlichkeit bzgl. eines Konfidenzintervalls - beschreibt die Wahrscheinlichkeit, mit der ein Populationsparameter im Konfidenzintervall liegt
Was sind die Voraussetzungen, um die Formel für das Konfidenzintervall anzuwenden?
n > 30 Stichprobe ist repräsentativ
Was besagt ein Konfidenzintervall von 95%?
dass in 95% aller Stichproben der wahre Mittelwert in diesem Intervall liegt die Irrtumswahrscheinlichkeit beträgt 5%
Was ist ein Konfidenzintervall?
Ein Bereich, in dem sich Populationsparameter befinden, die mit einer bestimmten Wahrscheinlichkeit als Erzeuger eines empirisch bestimmten Stichprobenkennwerts in Frage kommen.
Was ist das Konfidenzniveau?
Konfidenzniveau = Signifikanzniveau = Alpha = 1 - Konfidenzkoeffizient (die Restwahrscheinlichkeit außerhalb des KI)
Was ist der kritische Wert “x crit”?
die Stelle, wo die Grenzen des Konfidenzintervalls über- oder unterschritten werden
Wovon ist die Breite des Konfidenzintervalls wie abhängig?
vom Stichprobenumfang und der Wahl des Alpha
- je größer die Stichprobe, desto kleiner das KI (daher sollte man den Stichprobenumfang vor der Untersuchung ermitteln)
(Erklärung: in der Formel für das KI sind Mittelwert und Standardabweichung vorhanden, beide haben N im Nenner, ein größerer Nenner macht das Ergebnis kleiner) - je größer 1-α (= der Konfidenzkoeffizient), desto größer das KI
Was muss man bei Konfidenzintervallen mit n < 30 beachten?
nicht z-Werte, sondern t-Werte verwenden
Beschreiben Sie die studentische t-Verteilung (statistisch)!
die standardisierte Schätzfunktion des Stichprobenmittelwerts (normalverteilter Daten) ist nicht mehr normalverteilt, sondern t-verteilt, wenn
(a) die zur Standardisierung des Mittelwerts benötigte Varianz des Merkmals unbekannt ist und
(b) mit der Stichprobenvarianz geschätzt werden muss
(also: wenn wir σ² nicht kennen und s² verwenden müssen, wird die Vergleichsverteilung zur t-Verteilung)
Sie zeigt für kleine n eine größere Breite und Flankenbetonung als die Normalverteilung.
Beschreiben Sie die studentische t-Verteilung (historisch)!
= Student-t-Verteilung = Student’s distribution - 1908 von William Sealy Gosset entwickelt, er arbeitete in der Guinness-Brauerei, die gestalteten Veröffentlichung nicht, daher unter Pseudonym “Student” - R. A. Fisher belegte die zugehörige Theorie und d
Vergleichen Sie t-Verteilung und Normalverteilung!
Die t-Verteilung zeigt für kleine n eine größere Breite und Flankenbetonung als die Normalverteilung. Bei großem n geht sie in die Normalverteilung über.
Was sind t-Tests?
Hypothesentests mit der t-Verteilung
Was kann man mit der t-Verteilung berechnen?
die Verteilung der Differenz vom Stichprobenmittelwert zum wahren Populationsmittelwert
Wie berechnet man die Freiheitsgrade?
v = n-1
Was bedeutet es, dass H₀ und HA disjunkt sein müssen?
Sie dürfen sich nicht überschneiden.
Was ist das Ziel eines statistischen Tests?
die Ablehnung/Verwerfung der Nullhypothese
Wann kann ein statistischer Test zur Annahme der Nullhypothese führen?
Nie. Nur die Annahme der Alternativhypothese ist möglich.
Auch wenn man H₀ nicht verwerfen kann, muss sie nicht gültig sein.
Nennen Sie drei Varianten von Hypothesen!
- ungerichtet: unterstellt nur einen Unterschied
- gerichtet: unterstellt Unterschied in bestimmte Richtung
- spezifisch: unterstellt bestimmte Größe des erwarteten Unterschieds
Nennen Sie die fünf Schritte der Hypothesentestung!
1) Null- und Alternativhypothese formulieren 2) Stichprobenkennwertverteilung spezifizieren (gegen die prüft man) 3) Signifikanzniveau und kritischen Wert spezifizieren (unter welchem Wert soll die Fehlerwahrscheinlichkeit liegen) 4) Testgröße berechnen 5) passende Hypothese auswählen
Wann kann man einseitig, wann muss man zweiseitig testen?
einseitig: bei gerichteten Hypothesen möglich zweiseitig: bei ungerichteten Hypothesen nötig
Was ist ein Fehler 1. Art?
= Alpha-Fehler
= Ablehnen der an sich richtigen Nullhypothese
= Signifikanzniveau
die Wahrscheinlichkeit dafür ist α, sie wird vom Analytiker vorgegeben
Was gibt das Signifikanzniveau an?
Die Irrtumswahrscheinlichkeit des Tests bei einem α-Fehler
Was ist ein Fehler 2. Art?
= Beta-Fehler
= Ablehnen der an sich richtigen Arbeitshypothese
die Wahrscheinlichkeit dafür ist β
dieser Fehler ist meist nicht bekannt
1-β = Power des Tests
Was bezeichnet man als Power des Tests?
1-β (Beta ist die Wahrscheinlichkeit, die an sich richtige Arbeitshypothese abzulehnen)
Wie hängen Alpha und Beta zusammen?
- β wird größer, wenn α kleiner wird
- man kann nicht beide gleichzeitig verringern
Wie hängt Beta mit der Standardabweichung in der Grundgesamtheit zusammen?
- β wird größer, wenn σ größer wird
- die Unsicherheit in der Stichprobe wird größer
Wie hängt Beta mit der Stichprobengröße zusammen?
β wird größer, wenn n kleiner wird
Wie hängt Beta mit dem Mittelwert der Grundgesamtheit zusammen?
- β hängt vom Wert des wahren Parameters µ ab
- je dichter µ bei dem unter der H₀ angenommenen Wert liegt, desto größer ist die Wahrscheinlichkeit für einen β-Fehler
- Wenn der wahre Wert von µ bei der Annahme der Alternativhypothese nicht bekannt ist, kann β nicht berechnet werden (α schon)
Was versteht man unter der praktischen Bedeutsamkeit von Signifikanz?
- ein signifikantes Ergebnis sagt nur, dass es einen deutlichen Effekt gibt, aber nicht, wie groß dieser ist >> daher oft wenig praktische Bedeutung - ein Ergebnis, dessen praktische Bedeutsamkeit durch beachtlichen Mittelwertsunterschied offenkundig ist,
Wie legt man Alpha fest?
- vor der Analyse - meist 5% oder 1%
Was bedeutet α = 1%, wenn die H₀ richtig ist?
- wird diese Grenze unterschritten, ist dieses Ergebnis recht unwahrscheinlich
- will man ganz sicher gehen, sollte man α weiter verringern (0,1%)
- damit steigt aber die Wahrscheinlichkeit für einen β-Fehler
- bei sehr wichtigen/teuren/aufwändigen Experimenten hat eine fälschlicherweise abgelehnte HA bedeutende Konsequenzen
Definieren Sie “Effektgröße”!
Ein standardisierter Unterschied, der zwischen zwei Populationen mindestens bestehen muss, um von einem praktisch bedeutsamen Effekt zu sprechen.
Was ist zur Bestimmung der Effektgröße erforderlich?
- intensive inhaltliche Auseinandersetzung mit der Untersuchung
- sie muss vor der Durchführung der Prüfung bestimmt werden
Welcher Vorteil ergibt sich, wenn die Effektgröße festgelegt ist?
Der Stichprobenumfang wird kalkulierbar
Nennen Sie einige Effektgrößen!
- Cohen’s d
- Pearson’s r / Pearson-Korrelation r
- Glass’s ∆
- Hedges g
Was ist Cohen’s d?
- eine Effektgröße für Mittelwertsunterschiede zwischen zwei Gruppen mit gleichen Gruppengrößen n sowie gleichen Gruppenvarianzen σ²
- dient der Beurteilung der praktischen Relevanz eines signifikanten Mittelwertsunterschieds
Wozu dient bei Cohen’s d der Korrekturfaktor?
Der Korrekturfaktor (√2) dient als Schätzer für gleiche Gruppengrößen und unterschiedliche Varianzen.
Wie lassen sich die Effektgrößen zu Cohens d einteilen?
0,20: klein 0,50: mittel 0,80: groß
Was ist Pearson’s r?
das meistgenutzte und älteste Effektstärkenmaß
Wie lassen sich die Effektgrößen zu Pearson’s r einteilen?
0,1: klein 0,3: mittel 0,5: groß
Was sind und wozu dienen Metaanalysen?
- ermöglichen die Zusammenfassung von versch. Untersuchungen zu einem wissenschaftlichen Forschungsgebiet
- man fasst die empirischen Einzelergebnisse inhaltlich homogener Primärstudien zusammen
- Ziel: Effektgrößeneinschätzung - liegt ein Effekt vor und wie groß ist er?
Wann werden Metaanalysen v.a. eingesetzt?
wenn die Stichproben der Primärstudien zu klein für verlässliche Ergebnisse sind (durch das Zusammenfassen wird das Ergebnis genauer und sicherer)
Was kann Metaanalysen erschweren oder unmöglich machen?
Oft benutzen Primärstudien nicht dieselben Methoden, Definitionen oder dieselbe Population - dann ist fraglich, ob/wie man diese Einflüsse vom Gegenstand der Untersuchung trennen kann
Beschreiben Sie das methodische Vorgehen bei einer Metaanalyse!
- sie umfasst sämtliche Elemente des Forschungsprozesses wie in der Primärforschung
- zuerst Auswahl eines Forschungsproblems und genauere Eingrenzung
- Datenerhebung bei publikationsbasierten Metaanalysen = systematische und umfassende Literaturrecherche
- dann werden die gesammelten Infos kodiert und elektronisch aufbereitet
- die eigentliche/statistische Datenanalyse umfasst 2 Schritte: Befundintegration und Heterogenitätsanalyse
- dann Ergebnisse aufbereiten und mit Bezug auf das Forschungsproblem interpretieren
Unter welcher Voraussetzung macht es Sinn, verschiedene Untersuchungen zu einem Forschungsgebiet zusammenzufassen?
Wenn die Effektgrößen der einzelnen Untersuchungen Schätzungen einer gemeinsamen Populationseffektgröße sind.
Nennen Sie vier Probleme bei Metaanalysen!
- Garbage in Garbage out
- Äpfel-Birnen-Problem
- Schubladenproblem
- Problem der abhängigen Messungen
Was bedeutet “Garbage in Garbage out”?
Die Ergebnisse einer Metaanalyse sind wenig valide, wenn jede beliebige Untersuchung - unabhängig von ihrer methodischen Qualität - in die Metaanalyse eingeht.
Was ist das Äpfel-Birnen-Problem bei Metaanalysen?
wenn Untersuchungen mit versch. Operationalisierungsvarianten zusammengefasst werden
Was ist das Schubladenproblem bei Metaanalysen?
- Häufig werden nur Ergebnisse publiziert, die angenommene Hypothesen bestätigen oder signifikante Ergebnisse aufweisen - nicht signifikante Ergebnisse werden oft nicht veröffentlicht (Publikationsbias) - dadurch werden die metaanalytischen Ergebnisse ver
Was ist das Problem der abhängigen Messungen bei Metaanalysen?
- wenn versch. abhängige Teilergebnisse an der gleichen Stichprobe erhoben wurden - je Untersuchung darf immer nur EIN Ergebnis in die Metaanalyse eingehen, sonst bekommen Untersuchungen mit mehreren Ergebnissen zu großes Gewicht
Was ist die Teststärke?
= statistical power = die Wahrscheinlichkeit, mit der eine Untersuchung signifikante Ergebnisse liefert gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen Alternativhypothese entscheidet
Wie bestimmt/berechnet man die Teststärke?
Power = 1-β
(denn: β+Power = 100%)
man muss dazu aber bestimmte Parameter kennen, dafür gibt es Software oder Tabellen
Von welchen Faktoren hängt die Teststärke ab?
dir. prop.:
1) Effektgröße: kleiner werdende Differenzen µ₁−µ₀ >> geringere Teststärke
2) Stichprobengröße: je größer, desto stärker
indir. prop.:
3) Merkmalsstreuung: Teststärke sinkt mit wachsender Merkmalsstreuung (Anm.: σ?)
4) Signifikanzniveau: niedrige Signifikanzniveaus erhöhen die Teststärke
5) ein- bzw. zweiseitige Tests: Teststärke ist einseitig höher als zweiseitig
6) Art des Testverfahrens
Wenn Alpha, Beta und die Effektgröße inhaltlich festgelegt sind, was kann man dann noch frei bestimmen?
den Stichprobenumfang n
Wann ist ein Stichprobenumfang optimal?
wenn er bei gegebenen α, β und d eine eindeutige Entscheidung über die Gültigkeit von H₀ oder H₁ sicherstellt
Was ist ein Indifferenzbereich?
ein Bereich zwischen zwei kritischen Werten, in dem weder die H₀ noch die H₁ abgelehnt werden kann
- wenn N zu klein
>> Untersuchung mit größerer Stichprobe replizieren
oder ein Bereich zwischen zwei kritischen Werten, in dem sowohl die H₀ als auch die H₁ zu verwerfen sind
- wenn N zu groß
Wie berechnet man ein Zusammenhangsmaß (s²)?
indem man für den zweiten Term statt x eine andere Variable einsetzt (vgl. Formel zur Kovarianz)
Besteht zwischen zwei Variablen ein Zusammenhang, was gilt dann hinsichtlich ihrer Abweichungen?
Wenn eine Variable vom Mittelwert abweicht, dann auch die andere - in die gleiche ODER in die entgegengesetzte Richtung!
Wie lässt sich Kovarianz graphisch darstellen?
in einem Streudiagramm = scatter plot die Variablenwerte werden separat auf der x- und y-Achse aufgetragen und für alle Untersuchungseinheiten werden die sich ergebenden Kreuzungspunkte (xi,yi) im Graphen aufgetragen
Was bedeutet “positive Kovarianz”?
beide Variablen weichen in derselben Richtung vom Mittelwert ab
Was bedeutet “negative Kovarianz”?
die Variablen weichen in entgegengesetzte Richtung vom Mittelwert ab
Was ist der Unterschied zwischen Varianz und Kovarianz?
Die Varianz zeigt die Abweichungen einzelner Werte vom Mittelwert, während die Kovarianz die Abweichungen einzelner Werte von zwei Variablen zum jeweiligen Mittelwert darstellt.
Welches Problem kann es mit der Kovarianz geben?
- sie ist abhängig vom Maßstab der zugrundeliegenden Variablen - sie ist daher ein ungeeignetes Maß, wenn man von einem “wahren” Zusammenhang zwischen Merkmalen, unabhängig von deren Quantifizierung ausgeht - Lösung: z-Transformation
Was bezeichnet man als Korrelation?
die Kovarianz z-transformierter Variablen
Nennen Sie weitere Namen für den Korrelationskoeffizienten r!
r = Pearson’s r = Korrelationskoeffizient = Produkt-Moment-Korrelation
Was beschreibt der Korrelationskoeffizient r?
die Enge des linearen Zusammenhangs zweier Merkmale
Welche Werte kann der Korrelationskoeffizient annehmen?
Intervall von r: [-1,+1]
r=+1 … perfekt positiver (linearer) Zusammenhang
r=-1 … perfekt negativer (linearer) Zusammenhang
r=0 … kein (linearer) Zusammenhang
Warum werden Korrelationskoeffizienten mit Fishers Transformation in z-Werte umgerechnet?
- um mehrere r zu mitteln - zur inferenzstatistischen Absicherung von Stichprobenkorrelationen (da z-Werte annähernd normalverteilt sind) - um Konfidenzintervalle für r berechnen zu können Dadurch werden höhere Korrelationen bei der Mittelwertberechnung
Kann der Korrelationskoeffizient direkt interpretiert werden?
Ja
Kann man statistisch absichern, ob eine Korrelationskoeffizient signifikant von 0 abweicht?
Ja
Was prüft ein 1-Stichprobentest mit H₀: Rho = Rho₀?
ob eine Korrelation r zu einer Grundgesamtheit gehört, deren wahre Korrelation Rho₀ beträgt
Ab welcher Stichprobengröße führt die Transformation nach Fisher zu einer Normalverteilung?
N≥25
Was prüft ein 1-Stichprobentest mit H₀: Rho = 0?
ob eine empirisch ermittelte Korrelation r aus einer Grundgesamtheit mit Rho=0 stammt
Was prüft ein Test mit H₀: Rho₀ = Rho₁?
ob sich zwei Korrelationen aus zwei voneinander unabhängigen Stichproben signifikant unterscheiden bzw. ob sie aus derselben Grundgesamtheit stammen
Was prüft ein Test mit H₀: Rho₀ = Rho₁ = … = Rho k?
ob sich Korrelationen aus mehreren voneinander unabhängigen Stichproben signifikant unterscheiden bzw. ob sie aus derselben Grundgesamtheit stammen
Was ist die Prüfgröße V?
eine Chi-Quadrat-verteilte Prüfgröße mit df=k-1 wenn V größer als der kritische Wert ist, verwerfen wir die Nullhypothese
Was prüft ein Test mit H₀: Rho ab = Rho ac?
ob sich zwei Korrelationen aus zwei voneinander abhängigen Stichproben signifikant unterscheiden
Nennen Sie Eigenschaften von r!
- Verhältnisse zwischen Korrelationskoeffizienten sind nicht interpretierbar (Anm.: da nicht intervallskaliert, das sind erst die z-Werte) - Zuwachs im oberen Korrelationsbereich ist bedeutsamer als im unteren - das arithmetische Mittel von (mehreren) r
Wie kann man von Korrelationen auf Kausalität schließen?
Gar nicht. Höchstens “mit Mitteln der Logik” (steht auf Folie; gemeint ist, durch rationales Überlegen) Mögliche Interpretationen: - x beeinflusst y kausal - y beeinflusst x kausal - x und y beeinflussen sich gegenseitig kausal - x und y werden von einer weiteren Variable kausal beeinflusst r sagt nicht, was davon stimmt
Was ist die Voraussetzung für Pearson’s r?
Intervallskalenniveau der Daten
Soll jedoch vom Stichprobenergebnis auf die Grundgesamtheit geschlossen werden (Signifikanztest), …
- muss die Stichprobenkennwertverteilung normalverteilt sein
- müssen die Variablen einer bivariaten Normalverteilung folgen
- sollten beide Variablen normalverteilt sein (Ausnahme: wenn eine davon dichotom ist)
Kann man mit SPSS Konfidenzintervalle für r berechnen?
Nein (nur über Syntax) >> dafür müssen die Korrelationskoeffizienten Fisher-z-transformiert und in z-Werte umgerechnet werden; von der z-Einheit muss dann mit der Formel für r in Korrelationswerte umgerechnet werden
Wie berechnet man Stichprobenumfänge für Unterschiede zwischen Korrelationen?
- mit Fisher-z-transformierten Werten - bei Korrelationen ist eine Standardisierung nicht sinnvoll, daher verwendet man als Effektgröße qc
Wie ist die Effektgröße qc nach Cohen eingeteilt?
0.10 … kleiner Effekt 0.30 … mittlerer Effekt 0.50 … großer Effekt (Anm.: wie bei Pearson’s r)
Was ist für die Verallgemeinerung einer Korrelation auf eine Grundgesamtheit zu fordern?
- dass die Stichprobe zufällig gezogen wurde
- dass keine irgendwie geartete systematische Selektion getroffen wurde
Was ist eine punktbiseriale Korrelation (r pb)?
= Korrelation eines intervallskalierten Merkmals mit einem diskreten, dichotomen Merkmal
Nennen Sie Beispiele für diskrete dichotome Merkmale!
- Geschlecht: m/w (wobei…)
- schwanger: ja/nein
- Vitalzustand: am Leben/verstorben
Unter welchen Voraussetzungen kann eine punktbiseriale Korrelation mit SPSS berechnet werden?
wenn die dichotome Variable kodiert ist - z.B. 0 = “verstorben” und 1 = “am Leben” - die Kodierung kann auch mit anderen Zahlen erfolgen, intern weist SPSS jedoch 0 und 1 zu - die Reihenfolge der Kodierung ist egal, es ändert sich nur das Vorzeichen des Korrelationskoeffizienten
Was ist eine biseriale Korrelation?
= Korrelation eines intervallskalierten mit einem kontinuierlich dichotomen Merkmal (künstlich dichotomisiert, z.B. durch Mediansplit)
Nennen Sie Beispiele für kontinuierlich dichotome Merkmale!
- Raucher: ja/nein - Alter: jung/alt - Klausur bestanden: ja/nein bei kontinuierlich dichotomen Merkmalen gibt es (im Unterschied zu diskreten) innerhalb der Gruppen ein Kontinuum, z.B. “Gelegenheitsraucher” zwischen “ja” und “nein”
Wie kann man eine biseriale Korrelation berechnen?
nicht direkt mit SPSS man muss: - r pb bestimmen (mit SPSS) - p (%-Anteil in der größeren Gruppe der dichotomisierten Variablen) mit SPSS berechnen - q (%-Anteil in der kleineren Gruppe der dichotomisierten Variablen) mit SPSS berechnen - y (Ordinate in der z-Tabelle) auslesen
Vergleichen Sie biseriale und punktbiseriale Korrelation!
- biseriale Korrelation setzt Normalverteilung in beiden Merkmalen voraus; die zu dichotomisierende Variable muss vor der Teilung normalverteilt sein; die intervallskalierte Variable auch
- im Zweifelsfall sollte man die punktbiseriale Korrelation verwenden
- der Zusammenhang zweier normalverteilter Merkmale wird durch r pb unterschätzt!
Welche weiteren Korrelationstechniken kennen Sie?
- Spearman’s Rho: Intervall mit Ordinal; nichtparametrisches Verfahren (wenn parametrische Voraussetzungen verletzt wurden)
- Kendall’s Tau: bei kleinen Stichproben oder vielen Rangbindungen besser als Spearman’s Rho
- Phi-Koeffizient: dichotom mit dichotom (diskret)
- Tetrachorische Korrelation: dichotom mit dichotom (kontinuierlich/künstlich)
- biseriale Rangkorrelation r bisR: dichotom mit Ordinal
- Kontingenzkoeffizient C: Nominal mit Nominal
- Cramer Index CI: Nominal mit Nominal, für einen Vergleich mit anderen Korrelationsmaßen (Anm.: auch Cramér’s V oder Cramér’s Phi)
Was setzen parametrische Verfahren voraus?
Normalverteilung und Varianzhomogenität
Wie prüft man Normalverteilung?
Mit - Graphiken - Skew - Kurtosis - statistischen Tests auf Normalverteilung
Wie prüft man Varianzhomogenität?
mit Levene’s Test, Goldfeld-Quandt-Test, White-Test u.a.
Was kann man tun, wenn Voraussetzungen für parametrische Verfahren verletzt sind?
- transformieren: Log (bei Korrelationen), Quadratwurzel, reziproke Transformationen - robuste Tests verwenden
Nennen Sie zwei Beispiele für robuste Tests!
- Median: statt des arithmetischen Mittels, um den Erwartungwert einer symmetrischen Verteilung zu schätzen - RANSAC = random sample consensus (“Übereinstimmung mit zufälliger Stichprobe”)
Wann ist ein Schätz- oder Testverfahren robust?
wenn es nicht sensibel auf Aufreißer reagiert
Was folgt aus dem zentralen Grenzwerttheorem für die Stichprobenkennwertverteilung?
Wenn die Stichprobendaten annähernd normalverteilt sind, ist die Stichprobenkennwertverteilung ebenso normalverteilt.
Was ist ein Q-Q-Plot?
= Quantil-Quantil-Plot = ein Diagramm, das die Quantile einer Variable mit den Quantilen einer bestimmten Verteilung vergleicht - die erwarteten Quantile bilden eine Diagonale, die beobachteten Quantile sind als einzelne Punkte dargestellt - wenn Werte a
Auf welcher Annahme basiert der Q-Q-Plot?
Theoretisches Quantil ≈ Empirisches Quantil
Warum wird in der Formel für die Quantilsbestimmung 0,5 subtrahiert?
weil das 100%-Quantil für die Normalverteilung nicht definiert (bzw. α) ist
Was macht man mit dem Ergebnis der Formel für die Quantilsbestimmung?
aus den standardisierten Daten können anhand der inversen Normalverteilung (Phi hoch -1) die theoretischen Quantile für die erhaltenen z-Werte bestimmt werden
Was sind die Schritte zur Erstellung eines Q-Q-Plots?
1) Stichprobendaten nach aufsteigender Größe sortieren 2) z-Transformation der Rohdaten 3) Quantilszahlen bestimmen ( p i = (i-0,5)/n ) 4) Quantile aus der theoretischen standardnormalen Verteilung 5) Plot zeichnen 6) Güte der Passung bestimmen
Wie bestimmt man die Güte der Passung beim Q-Q-Plot?
- man berechnet die Gesamtvarianz der Daten (Formel) - für jeden standardisierten Rohdatenwert kann ein eigener Erwartungswert bestimmt werden, nämlich das zugehörige Quantil aus der theoretischen Verteilungsfunktion (Formel) = das ist die Fehlervarianz/u
Was ist der Wert der Gesamtvarianz s² bei standardisierten Daten?
immer 1
Was ist das p-Quantil?
ein Merkmalswert, der die Verteilung einer Variablen in zwei Abschnitte unterteilt es werden die Quantile der einen empirischen Verteilung auf die Abszisse und die Quantile der anderen empirischen oder theoretischen Verteilung auf der Ordinate abgetragen
Was ist ein P-P-Plot?
= Probability-Probability-Plot = ein grafisches Werkzeug, in dem die Verteilungsfunktionen zweier statistischer Variablen gegeneinander abgetragen werden, um ihre Verteilungen zu vergleichen empirische Verteilungsfunktion einer Stichprobe auf der Absziss
Wann setzt man P-P-, wann Q-Q-Plots ein?
- P-P-Plots sind besser, um zwei Stichprobenverteilungen zu vergleichen Q-Q-Plots sind besser für den Vergleich mit einer theoretischen Verteilung, daher meist für Testung auf Normalverteilung verwendet
Was können der Kolmogorov-Smirnov-Test und der Shapiro-Wilk-Test?
= statistische Tests auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen - anhand von Zufallsstichproben kann man damit prüfen, ob zwei Zufallsvariablen die gleiche Verteilung besitzen oder eine Zufallsvariable einer zuvor angenommenen Wahrscheinl
Was sind Null- und Alternativhypothese beim Kolomogorov-Smirnov-Test und dem Shapiro-Wilk-Test?
H₀: Dist₁ = Dist₂ (die Verteilung der beiden Zufallsvariablen ist gleich)
H₁: Dist₁ ≠ Dist₂ (die Verteilung der beiden Zufallsvariablen ist nicht gleich)
Was bedeutet ein signifikantes Ergebnis beim Kolmogorov-Smirnov-Test bzw. Shapiro-Wilk-Test?
die Stichprobenverteilung weicht signifikant von einer Normalverteilung ab
Die erfolgreiche Prüfung empirischer Daten auf Normalverteilung ist kein Indikator für …?
… die Validität des theoretischen Rationals
Was ist Varianzhomogenität?
= Homoskedastizität = wenn die Varianz der Residuen (= Abweichung des empirischen Werts vom vorhergesagten) für alle Ausprägungen der anderen Variablen nicht signifikant unterschiedlich ist
Was ist Varianzheterogenität?
= Heteroskedastizität
= unterschiedliche Streuung innerhalb einer Datenmessung