7. Hypthesenprüfende Untersuchungsformen Flashcards
Hypotheseprüfende Untersuchungen
überprüfen Annahmen über Zusammenhänge, Unterschiede oder Veränderungen von Merkmalen bei spezifischen Populationen
Variablenbeziehungen, prognostische oder erklärende Annahmen
nicht nur Stichproben, auch Einzelfälle
kausale Variablenbeziehungen (nicht in korrelativen Studien möglich)
Annahmen und Erkenntnisse sind nötig um Hypothesen zu formulieren
- begründet (Untersuchungsaufwand)
- nachvollziehbar (Notwendigkeit der Untersuchung)
- präzise (zweifelsfreie Entscheidung)
Forschungshypothese
Die fragen dir abgeleitet aus Beobachtungen, Voruntersuchungen oder Theorien bezüglich eines Untersuchungsgegenstands formuliert werden
Allgemeine
operationale
Statistische
Gerichtete vs. ungerichtete
Spezifische vs. unspezifische
Allgemeine Forschungshypothesen
Zusammenhangs-, Unterschieds- und Veränderungshypothesen
Operationale Hypothese
empirische Vorhersage bz.w. Prognose zum Ausgang der Untersuchung
sind Forschungshypothesen nachgeordnet
UV und AV sind festgelegt
müssen besonders präzise formuliert sein
Statistische Hypothese
Null- und Alternativhypothese
sind durch den jeweiligen Signifikanztest definiert und nehmen BEzug auf ddie Populationsparameter
Gerichtete vs. ungerichtete Hypothese
Differenzierung statistischer Hypothesen
ungerichtet = wenn keine Richtung für einen Zusammenhang oder Unterschied angegeben wird
gerichtet = wenn Vorzeichen die Richtung angiebt
Zusammengesetzte vs. Punkt- einfache Hypothesen
zusammengesetzte Hypothesen p< 0
Punkt- oder einfacher Hypothese p=0
Spezifische vs. unspezifische Hypothesen
Differenzierung statistischer Hypothesen
spezifische Hypothese = Mindestbetrag oder Mindestgröße (Effektgröße) wird spezifiziert die erreicht werden muss (zumeist mit gerichteter Hypothese kombiniert) mü1>mü2+x
unspezifische Hypothese = wenn Höhe oder Betrag ungenannt bleiben
Signifikanztests
werden eingesetzt, wenn die Populationsparameter unbekannt sind
vor Untersuchung Hypotheseart und alpha Nivau festlegen (im Nachhinein unzulässig, inhaltliche nicht statistische Überlegungen)
Alpha-Fehler
Fehler 1. Art : Ablehnung der Nullhypothese, obwohl diese wahr ist
Konventionell festgelegt (Signifikanzniveau 5% oder 1%)
Beta-Fehler
Fehler 2. Art: Annahme der Nullhypothese obwohl die Alternativhypothese wahr ist.
wird nur bei spezifischer Hypothese festgelegt
konventionelle Grenzwerte nicht festgelegt obwohl besser wäre
Entscheidung bei welchem Fehler die Konsequenzen verhängnisvoller wären schwierig
Praktisch schwierig zu betimmen, weil man dazu die H1-Verteilung kennen müsste. In zusammengesetzten Hypothesen einfacher, weil mehrere Parameterausprägungen möglich sind (Mindestwerte, Effektgrößen)
Univariate Zusammenhangshypothesen (schlussfolgernd aus Interdependenzhypothesen)
Cross-Sectional-Designs
AV Intervall - Bivariate Zusammenhangshypothesen
UVIntervall: Pearson r
UVOrdinal: Spearman rho, Kendalls tau b und c
UVKünstlich dichotom: Biseriale Korrelation
UVNatürlich dichotom: Punktbiserieale Korrelation
UV: Nominal: Eta, Kontingenzkoeffizient
AV Ordinal - bivariate Zusammenhangshypothesen
UVOrdinal: Kendalls Tau b und c, Gamma, Somers D
UVKünstlich dichotom: Biseriale Rangkorrelation
UVNatürlich dichotom: Biseriale Rangkorrelation
UVnominal: Kontingenzkoeffizient
AV künstlich dichotom - bivariate Zusammenhangshypothese
UV künstlich dichotom: Tetrachorische Korrelation
UV Natürlich dichotom: Phi-Koeffizient, Lambda, Unsicherheitskoeffizient
UV nominal: Kontingenzkoeffizient, Lambda, Unsicherheitskoeffizient
AV Nominalskala - bivariate Zusammenhangshypothese
UV Nominalskala: Kontingenzkoeffizient, Cramers V, Lambda, Unsicherheitskoeffizient
Kappa-Koeffizient
Interrater-Reliailität
Relative Risiko
Maß zur Messung des Zusammenhangs zwischen dem Eintreten eines Ereignisses und dem Vorligen eines Sachverhalts
Unterschieds- und Zusammenhangshypothesen
sind grundsätzlich ineinander überführbar
bivariate Zusammenhangshypothesen: wenn es für die Skalenkombination keinen geeigneten Test gibt > Transformation oder multivariate Zusammenhangshypothese (in linearen Zusammenhängen, wenn nicht dann exponentiell, log. log-linear, sigmoid)
repräsentative Stichproben sind nötig: bei einzelnem Merkmalsausschnitt Unterschätzung, bei Extremwerten Überschätzung
Multivariate Zusammenhangshypothesen
Partialkorrelation, multiple Korrelation, multiple Regressionsanalyse, kanonische Korrelation, Faktorenanalyse
Überprüfung von Abhängigkeit von Faktoren: zusätzliche konfirmatorische Faktorenanalyse und Strukturgleichungsmodelle
nominale Merkmale: Dummykodierung
Partialkorrelationen - Multivariate Zusammenhangshypothesen
Zusammenhang zweier intervallskalierter Merkmale wird durch mit en beiden korrelierte Drittvariable erklärt
Gemeinsamkeiten in Drittvariable rauspartialisiert
ohne Drittvariable = Korr. nullter Ordnung
mit einer Korr. = Korr. erster Ordnung
etc.
Semi-Partialkorrelationen (Partkorrelationen): Einfluss von Drittvariable wird nur aus einer Hauptvariable rauspartialisiert
multiple Zusammenhänge - Multivariate Zusammenhangshypothesen
multiple Korrelation und multiple Regression
mehrere Prädiktoren (nominal oder intervall) und ein Kriterium (intervall)
nominal: Prädiktoren werden in Indikatorvariablen transformiert
Dummykodierung: 0 Referenz , 1 Merkmal(k-1 Dummyvariablen) b0 ist Durchschnitt, b1 ist Abweichung
Effektkodierung: - 1 Referenz, b0 ist Gesamtmittelwert der AV und b1 Abweichungen Gruppewerte von Gesamtmittelwert (Treatmenteffekte)
Kontrastkodierung: Summe muss 0 ergeben, b0 ist Gesamtmittelwert der AV und b1 der Indikatorvariablen Funktion der Kontrastkoeffizienten die den jeweiligen Kontrast kodieren (Summe der Indikatorvariable ist 0)
kanonische Korrelation - Multivariate Zusammenhangshypothesen
wenn es mehrere Prädiktor- und mehrere Kriteriumsvariablen gibt
ähnelt Hauptkomponentenanalyse
Prädiktor- und Kriteriumsvariablen getrennt faktorisiert und rotiert
aus beiden Variablensätzen jeweils der Faktor extrahiert die am besten korrelieren der Rest wird auch zusammengelegt Paare orthogonal. Solang rotiert bis erschöpft
Determinationskoeffizient und Redundanzmaße
Faktorenanalyse - Multivariate Zusammenhangshypothesen
faktorielle Zusammenhänge: Merkmale (bzw. Items) könnten in weniger Faktoren oder Dimensionen zusammenschließen lassen
Zugehörigkeit der einzelnen Items wird durch Faktorladungen ausgedrückt (Korrelation zwischen Item und Faktoren)
interne Validität - Korrelationen
Korrelationen haben Problem interner Validität, keine Kausalität
nicht-signifikante Korrelationen können Kausalmodelle falsifizieren
Längsschnittstudien (Cross-lagged Panel Design) können konkurrierende Kausalmodelle einschränken und durch Pfadanalysen (unter Berücksichtigung manifester Variablen) sowie Strukturgleichungsmodelle (mit manifesten und latenten Variablen) verglichen werden
empirische Validierung nur über Replikation
Aus metaanalytischem Vergleich von Ergebnissen vergleicharere Untersuchungen Stärke der Kausaleffekte und Übertragbarkeit abschätzen
Pfadanalysen - Multivariate Zusammenhangshypothesen
Kausale Annahmen widerlegen sich aber lassen sich nicht eindeutig bestätigen
vor der Überprüfung müssen spezifische Modelle über Ürsache-Wirkungs-Sequenzen vorliegen
dient der Bestätigung ob ein spezifiziertes Modell mit den empirischen Daten überein
Strukturgleichungsmodelle - Multivariate Zusammenhangsanalysen
Kausale Annahmen widerlegen sich aber lassen sich nicht eindeutig bestätigen
gehen im vergl. zu Pfadanalysen über den schritt wechselseitiger Beziehungen hinaus, Annahmen über latente Merkmale (mit Beziehungen untereinander und anderen Merkmalen)
vor der Überprüfung müssen spezifische Modelle über Ürsache-Wirkungs-Sequenzen vorliegen
dient der Bestätigung ob ein spezifiziertes Modell mit den empirischen Daten überein
randomisierte Zwei-Gruppen-Pläne - Unterschiedshypothesen für zwei Gruppen
Treatment und Kontrollgruppe
nur ranomisierte Zuweisung
Erfolge nur in experimentellem Setting richtig zu interpretieren
t-test für unabhängige Stichproben oder matched Samples t-test für abhängige Stichproben oder nicht-parametrischer Test
Extremgruppenvergleich: nur äußerste Probanden - besitzt UV Erklärungswert von AV (Überschätzung der UV häufig, Vorraussetzung nicht erfüllt d.h. non-paramentrische
Mehr-Gruppen-Pläne - Unterschiedshypothesen für mehr als zwei Gruppen
Unterscheidet sich im Vorgehen nicht von zwei-Gruppen-Plan
Varianzanalyse, Post-Hoc, Kontrasttests
Kontraste (A priori): allein wenn vorher Einzelvergleichshypothesen formuliert wurden. Treatments zusammenfassen und mit anderen zu vergleichen. Trendtests: lineare, quadratische, kubische etc.
Post-Hoc (a posteriori): im Nachheinein feststellen welche Treatments sich signifikant unterscheiden
Mehrfaktorielle Pläne - Unterschiedshypothesen für mehr als zwei Gruppen
neben Haupteffekten werden auch Interaktionen überprüft
damit sich Gruppen nicht wesentlich unterscheiden (interne Validität): Parallelisierung, Matching, Konstanthaltung
Interaktionen und Haupteffekte - Mehrfaktorielle Pläne - Unterscheidungshypothesen für mehr als zwei Gruppen
ordinale Interaktion = Graphen verlaufen gleichsinnig, Haupteffekte bleiben interpretierbar
hybride Interaktion = Graphen verlaufen im einen gleichsinnig und im anderen nicht, nur einer der Haupteffekte bleibt interpretierbar
disordinale Interaktion = Graphen verlaufen nicht gleichsinnig, kein Haupteffekt ist interpretiertbar, Interpretation geht nur auf Basis einzelner Zellen
Interpretation solang deskriptiv wenn keine spez. Hypothese formuliert wurde
kovarianzanalytische Auswertung - Merkfaktorielle Pläne
Kontrollvariable wird erfasst und bei Auswertung möglicher Einfluss entfernt ähnlich der Partialkorrelation
Ziel ist auch Fehlervarianz der AV zu reduzieren
Auch nominalskalierte Kontrollvaraiblen können als Dummy-Variablen kovarianzanalytisch ausgewertet werden
multivariate Pläne
wenn mehr als eine abhängige Variable vorliegt gehen faktiorielle in multivariate Pläne über
hiermit können auch wechselseitige Beziehungen zwischen mehreren abhängigen Variablen aufgedeckt werden
für komplexe Konstrukte - mehrere Indikatorvaraiblen (steigerung der externen Validität)
Veränderungshypothesen
Fragen aus Grundlagen- Interventions- und Evaluationsforschung
Treatment bewirkt Veränderung einer AV
Pretest-Posttest-Design
zwei Gruppen-Design
Pretest-Posttest-Design - Veränderungshypothesen
Prätest-Posttest-Differenz auf der AV
multiple oder multivariate Varianzanalysen für Messwiederholungen
setzt gleichförmige Korrelationen zwischen allen Messwiederholungen voraus
Problematik Pretest-Posttest-Design
bei kleinem n Pretests um personenbedingte Störvariablen zu kontrollieren
Sequenzeffekte kontrollieren: verschiedene Abfolge je einer Zufallsstichprobe zuweisen
Positionseffekte: entstehen, wenn durch Messwiederholungen gleichartige Veränderungen (z.B. Ermüdung, Gewöhnung etc. ausgelöst werden)
bei quasi-experimentellen Untersuchungen zur Steigerung der internen Validität sollten mehr als zwei Messzeitpunkte vorgesehen werden (Anfang und Ende konzentrierter)
Streuung der Differenzwerte- Problematik Pretest-Posttest-Design
Indikator für Reliabilität von Differenzmaßen
je geringer die Streuung desto geringer die Reliabilität
Bei mehr als zwei Messungen keine Differenz sonder Regression
Reliabilität der Messungen - Problematik Pretest-Posttest-Design
Mit zunehmendem Messfehler der Messwerte sinkt die Reliabilität der Differenzwerte
kann auch an heterogenen Veränderungsraten liegen nicht zwangsläufig niedrige Reliabilität der Differenzen
Verteilung der Anzahl der Messzeitpunkte - Problematik Pretest-Posttest-Design
gleichabstädnig verteilte Messzeitpunkte über gesamte Erhebungsspanne
besser Anfangs und Ende engere Zeitabstände
Regressionseffekt - Regression zu Mitte
extreme Pretestwerte tendieren bei einer Wiederholung zur Mitte
Besonders kritisch bei der Überprüfung differentieller Wirkungen von Treatments an Personengruppen mit extremen Merkmalsausprägungen - kann nur durch Zufallsstichproben aus vergl. Populationen gelöst werden
Solomon-Vier-Gruppen-Plan
dient dazu mögliche Pretest-Effekte aus Vortests zu kontrollieren
vier randomisierte Gruppen
- Pretest - Treatment - Posttest
- Kontrolle: Prestest - Posttest
- One-Shot-Case-Design: Treatment - Posttest
- Posttest
Kontrolle von Treatment-Effekten (1+3), Pretesteffekte (1+2), Zeiteffekte (1+2+3+4)
Quasi-experimentelle Untersuchungen bei Veränderungshypothesen
Problematisch wenn Unterschiede zwischen Gruppen in der AV auf andere unkontrollierte Abweichungen zwischen Gruppen zurückgeführt werden können
konfundierte Merkmale ermitteln
mehrere abhängige Variablen
wiederholte Treatmentphasen
Parallelisierung der Gruppen wenn Matching durch stabile Merkmale erzielt wrden kann > beachte Regressionseffekte
Zeiteffekte - Veränderungshypothesen über Zeit
neurophysiologische Reifungsprozesse gekoppelt am Verhalten
Gedächtnis, Wahrnehmung, Denken
Querschnitt: Epochale und Generationsunterschiede konstanthalten, Abhängigkeit der Validität des Messinstruments von Alter
Längsschnitt: Generation variieren, epochale Effekte konstanthalten, Ausfall von Probanden, Übungseffekte, Veränderung der Validität der Messinstrumente
Cohort-Sequential-Method
Time-Sequential-Method
Epochale Effekte - Veränderungshypothese über Zeit
Verhaltensbesonderheiten in verschiedenen Zeitabschnitten
gekoppelt an spezifische gesellschaftliche Erscheinungen
Querschnitt: Alter konstanthalten (vernachlässigen), Generation variieren
Längsschnitt: Alter variieren, Generation konstanthalten
Tim-Sequential-Method
Cross-Sequential Method
Generations- und Kohorteneffekte - Veränderungshypothese über Zeit
bedingt durch Geburtszeitpunkt
Vorkriegs- vs. Nachkriegsgeneration
Querschnitt: konstanthaltung Epoche
Längsschnitt: Konstanthaltung Alter
Cohort-Sequential-Method
Cross-Sequential-Method
Cohort-Sequential-Method
Messwiederholungsdesign
versch. Generationen werden mit versch. Altersstufen untersucht
versch. Erhebungszeitpunkte
Epochale konstant, vernachlässigt, ignoriert
Time-Sequential-Method
Messwiederholungsdesign
verschiedene Epochen und Alter systematisch variiert
in jeder Faktorstufenkombination wird eine andere Zufallsstichprobe gezogen
Generations konstant, vernachlässigt
Cross-Sequential-Method
Messwiederholungsdesign
Epochen- und Generationsfaktor wird variiert
Alterseffekt konstant, ignoriert, vernachlässigt
Zeitreihenanalyse (z.B. ARIMA-Modelle) - Veränderungshypothesen für Zeitreihen
Vorhersagemodelle - wiederauftretende Regelmäßigkeiten
Interventionsmodelle - Veränderungen in Zeitreihen durch spezifische Ereignisse
Transferfunktionsmodelle - Veränderungen in Zeitreihen durch andere Zeitreihen
indirekte Veränderungsmessungen
mehr als zwei Messungen um da Ausmaß von Veränderungen und deren Stabilität abzuschätzen
Veränderungen können sein:
Zufallseffekte (Merkmalsoszillationen)
statistische Effekte (Regressionseffekte)
Folge eines Treatments oder Intervention
Reliabilität Differenzen
Paradoxon: Reliabilität der Differenzen ist umso geringer, je höher die Reliabilität der Einzeltestungen ist
Eignet sich nicht für Interpretation bei Einzelfällen
Probleme: Regression zur Mitte
Ausgangswertgesetz: Die Höhe des Anfangswertes ist negativ mit dem Zuwachs korreliert
Physikalismus - Subjektivismus - Dilemma: Numerisch gleiche Differenzen stehen nicht selbstverständlich für gleiche Merkmalsveränderungen (Noten)
festgelegter Stichprobenumfang - Power
wenn n groß genug, kann jede Nullhypothese verworfen werden
Weil alpha-Fehler nach Cohen viermal so schwer wie beta (s. Kapitel 8. nur für Wissenschaftler nicht Diagnostiker) kann alpa 5% und beta 2% sein
bei Effektgrößen beachten: beta-fehler < alpha-fehler für n, erwartete Differenzen müssen zusätzlich an Streuung relativiert sein.
- verwendeter stat. Test 2. Angabe alpha-Fehler 5% 3. Angabe Teststärke 80% bis 95% 4. Angabe Effektstärke 5. Art der Testung einseitig kleines n zweiseitig großes n
zwei Tests mit gleicher H1 vergleichen (paramterische BEdingungen) = relative Effizienz, Asymptotische relative Effizienz (nicht von alpha und Effektgröße abhängig)
Effektgrößen
vor der Untersuchung und nach der Untersuchung (ex-post Bestimmung)
wenn keine sicheren Größen festliegen - Klassifikationstabellen von Effektgrößen (klein, mittel, stark)
Effektgrößen - Standardisierte Differenzen
Unkorrigiert:
Glass g’ oder Delta: relativiert Mittelwertdifferenz auf Standardabweichung einer Kontrollgruppe, positivitätsbias
Cohens d: typisch bei t-Tests für unabhängige Stichproben, gepoolte Standardabweichung beider Gruppen, positivitätsbias, kann in R2 rückkonvertiert werden
Korrigiert:
Thomsons korrigiertes d*: Effekgrößen können zur Verhinderung des Positivitäsbias um den Stichprobenfehler korrigiert werden.
Effektgrößen - Indizes für Varianzaufklärung
wenn Mittelwerte nicht von Interesse sind, sondern Variabilität von Werten besonders im nicht-experimentellen Setting
Unkorrigiert:
R2: Regressionsanalysen, Explaind Quadratsumme
eta2 (n2): Varianzanalysen, Between Quadratsumme
Korrigiert:
Kelleys epsilon2: gleich wie omega2, andere Berechnung, äquivalent zu Eta2
Hays omega2: bei fixed effect models, nominalvariable ICC: bei random effects, einzelne Kategorien in Zufallsstichprobe
Adjustiertes R2
Power
abhängig vom statistischen Test
abhängig von der Stichprobengröße - großes n= große Power
abhängig vom Ausmaß experimenteller Effekte
abhängig vom Ausmaß des Fehlers
Metaanalyse
homogene Primäruntersuchungen mit gemeinsamer Thematik anhand statistischer Indikatoren aggregieren und komprimieren
wichtig: Effektgröße
Zusammenfassung Forschungsergebnisse, Vorbereitung Evaluationsstudien (Kosten-Nutzen)
basiert auf einer Gesamtstichprobe die sich additiv aus den Einzelstichproben der Studienergibt
Delta: zur vereinheitlichung von Effektgrößen, Schätzung wahrer Merkmalszusammenhänge,
Probleme - Metaanalysen
Qualitätskriterien der einzelnen Studien berücksichtigen und anhand objektiver Kriterien nachvollziehbar machen
interne Validität lässt sich empirisch methodisch kontrollieren
methodisch gute und schlechte Studien anhand von Effektstärken nicht zu erkennen (evtl. Variabilität)
transparenz in Darstellung
UVs umfassender und abstrakter: homogene Untergruppen bilden
AVs Definition strengere Regeln
Effektgrößen müssen Homogen sein (chi-Quadrat Homogenitätstest, kleine Power erst bei 4 Studien und n= 50)
75% Regel: Streuung des Delta, 75% der Varianz von Delta muss durch Unterschiedlichkeit der Untersuchungen erklärbar sein (auch kleine Power, alpha-Fehler, trotzdemb esser als Homogenitätstest)
bei heterogenen Deltamaßen: Moderatoren, multiple Korrelationen, wenn sig. aufteilung in homogene Gruppen (Clusteranalyse)
Metaanalysen vergleich andere Analysen
umfassender und abstrakter besonders UVs