M1 F8 Flashcards

1
Q

Im Folgenden werden zwei Typen von Untersuchungsdesigns vorgestellt, die in der Regel als quasi-experimentelle klassifiziert werden und besonders für die Evaluationsforschung wichtig sind. Welche sind das?

A

1 Anordnung mit nicht gleichartiger Kontrollgruppe

2 Einfache und mehrfache Zeitreihenanordnung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Ist bei einer Evaluationsstudie eine Zufallszuordnung der Probanden zu den verschiedenen Untersuchungsbedingungen bzw. Treatments möglich?

A

Aufgrund der bisherigen Erläuterungen zu quasi-experimentellen Designs ist schon per definitionem ausgeschlossen, dass bei einer Evaluationsstudie eine Zufallszuordnung der Probanden zu den verschiedenen Untersuchungsbedingungen bzw. Treatments möglich ist (z.B. Abteilungen in Betrieben oder Organisationen; Schulklassen; Gruppen in Kindergärten; Stationen in Pflegeheimen).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Beschreibe Sinn und Zweck der Randomisierung bestehender Gruppen!

A

Da bei Evaluationsstudien häufig mit bestehenden Gruppen als Einheiten gearbeitet werden muss, bleibt wenigstens zu prüfen, ob den verschiedenen Untersuchungsbedingungen per Zufall bestimmte Gruppen bzw. Abteilungen zugeordnet werden können. Dadurch kann eine systematische Bevorzugungen oder Benachteiligungen von Gruppen bzw. Abteilungen bei der „Zuteilung“ von Schulungen, Innovationen oder Interventionen vermieden werden. Diese Randomisierung bestehender Gruppen führt jedoch – im Gegensatz zur Randomisierung einzelner Personen nicht zu einer Vergleichbarkeit der Untersuchungsgruppen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie kann man in Evaluationsstudien die fehlende Vergleichbarkeit der Untersuchungsgruppen ausgleichen?

A

Um die Unterschiede zu erfassen, die bereits vor Beginn des Treatments zwischen den Gruppen (und auch zwischen den einzelnen Probanden) in den zu beeinflussenden abhängigen Variablen – sowie bei wichtigen Kontrollvariablen – bestehen, ist deshalb ein Vortest obligatorisch. So entsteht eine Kontrollgruppenanordnung mit Vor- und Nachtest, die ähnlich bereits im Kap. 7.2.3 als „echte experimentelle Anordnung“ vorgestellt worden ist, weil zusätzlich eine Randomisierung der Probanden Bestandteil des Designs war.
Die Randomisierung bestehender Gruppen wird hier durch (R) dargestellt.

(R)O1X O2(Versuchgruppe mit Vor- und Nachtest) (R)O1O2(Kontrollgruppe mit Vorund Nachtest)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Störfaktoren gibt es in Evaluationsstudien bei der Randomisierung bestehender Gruppen?

A

Störfaktoren der kausalen Interpretation von Haupteffekten des Treatments auf die abhängige(n) Variable(n) liegen bei diesen Designs insbesondere im Bereich der Anfangsunterschiede zwischen den Gruppen – und sollten durch Erhebung wichtiger Einflussfaktoren beim Vortest kontrolliert werden. Ansonsten gilt für

dieses Design, dass die möglichen Haupteffekte der folgenden Typen von Störfaktoren kontrolliert werden:
Testeffekte sowie Veränderung der verwendeten Hilfsmittel, natürliche Änderungsprozesse und zwischenzeitliches Geschehen (vgl. Abschnitt 7.2.4). Auch Wechselwirkungen zwischen diesen Typen von Störfaktoren und der Zuordnung zu den Untersuchungsbedingungen können bei dieser Anordnung durch die Randomisierung der Gruppen weitgehend ausgeschlossen werden.

Hinweis: Falls keine Zufallszuordnung der Gruppen realisiert werden kann, müssen die möglichen Wechselwirkungen zwischen den genannten Typen von Störfaktoren und dem jeweiligen Treatment geprüft werden (vgl. dazu die detaillierte Diskussion der Anordnung 10 bei Campbell & Stanley, 1970, S. 564).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist - bei Evaluationsstudien mit nichtgleichartiger Kontrollgruppe - das Problem bei folgendem Fall: Wenn kein Vortest durchgeführt werden konnte – und beim Nachtest nur die abhängige Variable und keine weiteren Kontrollvariablen erhoben wurden?

A

Bei einer solchen Untersuchung kann der Haupteffekt des Treatments mit Haupteffekten der wichtigsten Störfaktoren konfundiert sein. Dazu sei ein Beispiel genannt, dem ein Evaluationsdesign zugrunde lag, bei dem bestimmte verfügbare Daten nachträglich für eine bestimmte Fragestellung ausgewertet wurden (ein sogenanntes „ex-postfacto-Design): Im „Prolog“ ihres Handbuchbeitrages „Experimentation in Social Psychology“ berichten Aronson, Wilson und Brewer (1998, S. 99 f.) über eine Evaluation von „college-level educational programs in our prisons“, über die ein enthusiastischer Pressebericht erschienen war, und stellen zu dem Bericht eine zentrale methodische Frage:

Are the prisoners who were „assigned“ to the control condition the same kind of people as those „assigned“ to the experimental condition? That is, might it not be the case that the prisoners who signed up for the course of study and completed a year of it were different to begin with (say in motivation, ability, intelligence, prior education, mental health, or what you have) from those who did not sign up for the course – or those who signed up but dropped out early? (S. 99)

Dieses sozialpolitische Beispiel soll die Interpretationsprobleme allzu einfacher Untersuchungsdesigns und die praktische Relevanz interner Validität zeigen. Dieses Beispiel zeigt auch die Grenzen der o.g. Strategie der Randomisierung von Gruppen: dieses Verfahren ist im Fall der freiwilligen Teilnahme einzelner Personen nicht anwendbar. Als Alternative bleibt – wie beim Experiment, die Möglichkeit der Randomisierung der Personen, wenn einer großen Zahl von Interessierten eine viel kleinere Zahl an „Versuchsplätzen im Feld“ gegenübersteht, sodass die Gesamtliste der Interessierten per Zufall aufgeteilt werden kann in eine Versuchs- und eine Kontrollgruppe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nenne ein Beispiel für eine Randomisierung von Gruppen in einer quasi-experimentellen Studie - und erkläre, warum es kein Experiment ist!

A

Im Themenbeispiel „Statistik-Lernen in virtueller Lernumgebung“ (vgl. Abschnitt 7.2.2) würde ein solches Vorgehen bedeuten, bei 200 interessierten Studierenden nur 100 diese neue Lernmöglichkeit zu offerieren und sie per Zufall auszuwählen, die anderen 100 aber zu einer Art Kontrollgruppe zusammenzufassen und ihnen z.B. eine etwas verbesserte Variante der klassischen Lernmaterialien oder Präsenzveranstaltungen anzubieten (also ein alternatives Treatment).
Eine solche Untersuchung, die – mit oder ohne Vortest – über ein Semester laufen würde und die abschließende Klausur als Nachtest verwendet, würde trotz der angewendeten Randomisierung nicht unbedingt als Experiment klassifiziert, weil keinerlei Kontrolle über das Treatment als einem zentralem Element eines Experimentes besteht, von einer Standardisierung des Treatments (z.B. durch streng gesteuerte Abfolge von interaktiven Übungen in der Kabine eines Labors) ganz abgesehen. Es wäre sehr aufwendig zu erfassen, wann und wie lange die einzelnen Versuchspersonen welche interaktiven Übungen zur Statistik wie genutzt haben. Durch eigene Auswahl der Übungen würde jede Versuchsperson ihr Treatment quasi selbst zusammenstellen. Diese Skizzierung soll zweierlei zeigen:

  1. Eine fehlende Standardisierung des Treatments kann zwar inhaltlich sinnvoll sein (insbesondere bei der Untersuchung individueller Arbeitsund Lernprozesse), führt aber zu Problemen bei (a) der Beschreibung und Vergleichbarkeit individueller Aktivitäten bzw. Treatments und (b) bei der Interpretation der Treatmenteffekte: worauf sind eventuell aufgetretene Unterschiede zurückzuführen?
  2. Je komplexer ein Treatment ist (d.h. je mehr einzelne Komponenten es umfasst), desto weniger kann festgestellt werden, auf welche der einzelnen Komponenten aufgetretene Effekte zurückzuführen sind.
    Sollte z.B. untersucht werden, welche 3 aus 10 verfügbaren interaktiven Übungen am effektivsten für das Erlernen der Grundbegriffe schließender Statistik sind, so müssten alle möglichen Kombinationen von 3 aus 10 Übungen mit Berücksichtigung der Reihenfolge in jeweils einer Untersuchungsgruppe erprobt werden (also insgesamt 720 Treatments). Dieses Vorgehen ist auch indiziert bei Untersuchungen zur Frage einer optimalen Kombination von Medikamenten, therapeutischen oder sozialpädagogischen Einzelmaßnahmen (z.B. zur Therapie bestimmter Erkrankungen oder abnormer Verhaltensweisen). Wenn nur insgesamt 2 Komponenten untersucht werden sollen, so genügt aber ein einfaches zweifaktorielles Design mit 4 Untersuchungsgruppen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist der Unterschied zwischen echten experimentellen Anordnungen und Zeitreihenanordnungen?

A

Ein konzeptuell anderer Ansatz für die Diagnose von Treatmenteffekten liegt einer Zeitreihenanordnung bzw. einem Zeitreihendesign zugrunde. Während in echten experimentellen Anordnungen die Untersuchung des Effekts des Treatments durch Vergleich der Versuchsgruppe mit einer Kontrollgruppe erfolgt, und ein Vortest eher zur Kontrolle von Gruppenunterschieden dient, wird bei Zeitreihenuntersuchungen der Effekt des Treatments nicht primär über den Gruppenvergleich bestimmt, sondern durch Vergleich des – über mehrere Messzeitpunkte bestimmten durchschnittlichen Wertes der abhängigen Variable bei der Person i vor dem Treatment mit dem durchschnittlichen Wert derselben Person nach dem Treatment.
Dieses Design kann als Längsschnittdesign bzw. als Panelstudie klassifiziert werden, da über einen längeren Zeitraum Erhebungen an denselben Personen durchgeführt werden (die Intervention ist dabei nicht berücksichtigt).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ist jede mehrfache Messung derselben Person mit einem Längsschnittdesign verbunden?

A

Werden allerdings in einer Laboruntersuchung z.B. physiologische Reaktionen auf einen bestimmten Stimulus wiederholt vor und nach dessen Präsentation gemessen, um den zeitlichen Verlauf der abhängigen Variable zu analysieren, so wird diese Untersuchung zwar das gleiche Design haben, aber in einer „Sitzung“ durchgeführt und nicht als Längsschnitt bezeichnet. Jedes EKG, das in einer ärztlichen Praxis z.B. unter körperlicher Belastung des Patienten erstellt wird, ist nur eine Diagnose und keine Längsschnittuntersuchung, auch wenn zu mehreren, aufeinanderfolgenden Zeitpunkten gemessen wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist der Unterschied zwischen Zeitreihenanordnung und Zeitreihenanalyse?

A

Der Begriff Zeitreihenanordnung ist vom Begriff Zeitreihenanalyse zu unterscheiden: Letzterer bezeichnet eine Gruppe statistischer Verfahren, die zur Auswertung von vielfach wiederholten Messungen (n > 9) angewendet werden. Diese statistischen Verfahren unterscheiden sich wie die Zeitreihenanordnung in der Perspektive, aus der Zeitreihendaten (im Gegensatz zur einmal wiederholten Messung bei Designs mit Vor- und Nachtest) betrachtet werden können: im Focus stehen nicht interindividuelle Unterschiede (zwischen den Probanden) wie bei der Berechnung von Varianzen im klassischen Experiment, sondern die intraindividuellen Schwankungen der Messwerte, die bei wiederholten Messungen von Variablen bei den einzelnen Probanden bestimmt werden können.
Mit Hilfe solcher Verfahren kann untersucht werden, ob zwei Variablen y 1 und y 2 zeitversetzt miteinander korrelieren, d.h. ob Daten einer Zeitreihe y 1i(t) mit Daten einer Zeitreihe y 2i(t-x) einen signifikanten Zusammenhang zeigen. Einführungen in diese Auswertungsverfahren geben neuere Lehrbücher (z.B. Bortz & Döring, 2006, S. 568 ff. sowie Rohwer & Pötter, 2001, S. 181); Vertiefung bietet die Monographie von Schmitz (1987). Eine Anwendung dieser Methodik auf „studentisches Arbeiten“ hat Meier (1981) durchgeführt.

O1O2O3XO4O5O6O7(Versuchgruppe)
O1O2O3O4O5O6O7(Kontrollgruppe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist der Unterschied zwischen einfacher und mehrfacher Zeitreihenanordnung?

A

Besteht eine Zeitreihenanordnung nur aus der Versuchsgruppe, wird das Design als einfache Zeitreihenanordnung bezeichnet, sonst als mehrfache. Das Fehlen einer Vergleichsgruppe hat erhebliche Auswirkungen auf die interne Validität. Campbell und Stanley (1970) betonen, dass beim mehrfachen Zeitreihendesign alle Störfaktoren der internen Validität kontrolliert werden und kommen deshalb zu der Bewertung, das dies „eine ausgezeichnete quasi-experimentelle Anordnung, vielleicht die beste der brauchbaren Anordnungen“ ist, die besonders für die Unterrichtsforschung geeignet sei, da hier ohnehin „wiederholte Messungen leicht vorgenommen werden können“ (S. 585).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nenne ein Beispiel für eine Zeitreihenanordnung!

A

Dafür sei eine Studie im Schulbereich skizziert, bei der die Effekte von einwöchigen Klassenfahrten auf die Soziale Integration in Schulklassen der Jahrgangsstufe 5 untersucht werden soll. Die Operationalisierung der abhängigen Variable könnte z.B. durch ein Soziogramm erfolgen, das monatlich erhoben wird (zur Soziometrie s. Witte, 1989, Kap. C.2.1.4).
Wird eine solche Studie z.B. an einer großen weiterführenden Schule durchgeführt, in der die Orientierungsstufe (im Land NRW) sechs Parallelklassen hat, so könnten die Klassenfahrten aus organisatorischen Gründen nicht zeitgleich stattfinden, sondern zeitversetzt (z.B. mit jeweils zwei Klassen gleichzeitig). Damit ergibt sich ein Untersuchungsdesign, das als „Zeitreihenanordnung mit wechselnden Treatments“ bezeichnet wird und eine sehr gute Kontrolle verschiedener Störfaktoren (insbesondere des zwischenzeitlichen Geschehens) erlaubt, weil zu jedem Treatment mehrere Klassen als Kontrollgruppen zur Verfügung stehen – und hier außerdem in jeweils zwei Gruppen bzw. Klassen das Treatment zeitgleich erfolgt.

(Klasse5A) O1 O2 XA O3 O4O5O6O7
(Klasse5B) O1 O2 XB O3 O4O5O6O7
(Klasse5C) O1 O2 O3 O4XCO5O6O7
(Klasse5D) O1 O2 O3 O4XDO5O6O7
(Klasse5E) O1 O2 O3 O4O5O6XEO7
(Klasse5F) O1 O2 O3 O4O5O6XFO7

In dem skizzierten Beispiel wäre es sicher möglich, die Entscheidung über den Zeitpunkt der Klassenfahrt zu randomisieren, d.h. per Zufall die Klassen zu einem der drei fixierten Zeitpunkte der Zeitreihenanordnung auf Klassenfahrt zu schicken. Eine solche Randomisierung der Gruppen wäre eine methodisch begründete Alternative zu einer bedarfsorientierten Zuordnung der Klassen zu Terminen (z.B. diejenigen Klassen zuerst, in denen die meisten Außenseiter und Konflikte existieren).

Unabhängig von solchen systematischen Unterschieden zwischen einzelnen Klassen würden Daten des dargestellten Designs es erlauben, Antworten auf folgende Fragen zu geben, für deren Beantwortung ein Zeitreihendesign notwendig ist:

Gibt es signifikante Unterschiede des Treatments zwischen den Klassen, die zum gleichen Zeitpunkt die Klassenfahrt unternommen haben? Gibt es z.B. Wechselwirkungen zwischen dem Treatment Klassenfahrt einerseits und Merkmalen der Klassen bei vorherigen Messungen? Sind die Effekte bei Klassen mit vielen Außenseitern und Konflikten größer als bei „mittleren“ Klassen? Welchen Anteil hat dabei der sogenannte Regressionseffekt? Zu welchem der gewählten Zeitpunkte hat das Treatment „Klassenfahrt“ den größten Effekt auf die abhängige Variable Soziale Integration? Inwieweit können Indikatoren der Sozialen Integration in einer Klasse durch die Messwerte vom vorherigen Erhebungszeitpunkt erklärt werden (d.h.: wie hoch ist die sogenannte Autokorrelation dieser Messwerte)?

Bevor ein aktuelles Beispiel einer Zeitreihenanordnung skizziert wird, sei auf den in Abschnitt 7.6 erläuterten Aspekt kausaler Analysen hingewiesen, da er bei der Planung von Zeitreihenuntersuchungen von zentraler Bedeutung ist:

Es müssen Annahmen über den kausalen Prozess, der von der Interventionsmaßnahme zum Eintreten von (erwünschten wie unerwünschten) Effekten führt, getroffen werden, die zur Festlegung des konstanten Zeitintervalls geeignet sind, das jeweils zwischen den wiederholten Messungen der abhängigen Variable(n) liegen soll. (Schmitz, 1987, S. 137)

Dabei müssen interindividuelle Unterschiede der kausalen Verzögerung zwischen dem Beginn der Maßnahme und dem Eintreten des Effekts einkalkuliert werden bei Evaluationen mehrerer Organisationen auch interinstitutionelle Unterschiede.

Im Beispiel von Klassenfahrten als Interventionsmaßnahme zur sozialen Integration müssen die Erhebungen der Soziogramme mindestens monatlich erfolgen, bevor die Effekte von Klassenfahrten womöglich nicht mehr feststellbar oder durch „zwischenzeitliches Geschehen“ überlagert sind. Auch der Prozess des „Abklingens“ von Effekten der bei sozialen Interventionen, wie auch Lernprozessen zu beobachten ist (s.o. Vergessenskurve), kann nur durch entsprechend kurze Zeitintervalle zwischen den Messungen erfasst werden. Die praktische Grenze einer täglichen Erfassung wird vom Gegenstand abhängen. Bei Soziogrammen sind keine wesentlichen systematischen Schwankungen zu erwarten, bei anderen Themenbereichen dagegen schon (vgl. Lambertz, 1999).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind korrelative Designs?

A

Korrelative Designs dienen der Untersuchung von Fragen bzw. Hypothesen zu Zusammenhängen zwischen psychologischen Variablen bzw. Konstrukten. Dabei können sowohl lineare als auch nicht-lineare Zusammenhänge analysiert werden. Als Design kommen sowohl Querschnitts- oder Längsschnittuntersuchungen in Frage, wobei letztere wiederholte Erhebungen an denselben Personen erfordern; dadurch ermöglichen sie auch deskriptive Aussagen über mögliche Veränderungsprozesse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was wird in der Korrelationsforschung untersucht?

A

In der Korrelationsforschung werden Zusammenhänge zwischen zwei oder mehreren Merkmalen untersucht. Während die experimentelle Forschung darauf abzielt, Variationen der abhängigen Variable(n) durch die Manipulation von unabhängigen Variablen selbst herzustellen, geht es in der Korrelationsforschung um Zusammenhänge zwischen bereits existierenden Variationen zwischen Merkmalen von Individuen, sozialen Gruppen oder anderen interessierenden Merkmalsträgern (vgl. Cronbach, 1957): Gibt es z.B. einen Zusammenhang zwischen Intelligenz und Berufserfolg? Wie hängen Persönlichkeitsmerkmale mit der Bewältigung von Stress zusammen? Welche soziodemographischen (z.B. Alter, Geschlecht, Bildungsstand) und welche Persönlichkeitsmerkmale (z.B. Extraversion, Gewissenhaftigkeit, Impulsivität) hängen mit welchen Arten der Internetnutzung zusammen?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Benenne die Unterschiede zwischen Korrelationsstudien und Experimenten!

A

Das Experiment gilt für die psychologische Forschung zwar als der „Königsweg“, weil mit dieser Methode kausale Beziehungen zwischen unabhängigen und abhängigen Variablen untersucht und aufgedeckt werden können. Die experimentelle Methode setzt allerdings voraus, dass sich unabhängige Variablen willkürlich variieren und Störvariablen möglichst vollständig kontrollieren lassen. Diese Bedingungen können bei vielen psychologischen und insbesondere sozialwissenschaftlichen Fragestellungen aus prinzipiellen, ökonomischen und ethischen Gründen nicht realisiert werden. Wenn z.B. die Bedeutung von Persönlichkeitsmerkmalen für Gesundheit und psychisches Wohlbefinden untersucht werden soll, dann können Persönlichkeitsmerkmale wie z.B. Extraversion, Gewissenhaftigkeit und emotionale Labilität nicht willkürlich variiert, d.h. hergestellt werden, da diese Eigenschaften als sogenannte Organismusvariablen bereits in einer bestimmten Ausprägung vorliegen. Ein Experimentator kann eine Person nicht gewissenhafter oder extravertierter machen als sie ist. Ein anderes Beispiel ist das Geschlecht eines Untersuchungsteilnehmers, das vom Experimentator natürlich auch nicht willkürlich verändert werden kann. Organismusvariablen können in einem Experiment zwar nicht systematisch variiert, aber selegiert werden, d.h. das Geschlecht einer Versuchsperson kann als zusätzlicher Faktor in einem mehrfaktoriellen Design berücksichtigt werden. Bei anderen Fragestellungen ist ein experimenteller Zugang aus ökonomischen oder ethischen Gründen nicht möglich. Ein weiterer Vorteil der Korrelationsforschung gegenüber experimentellen Designs ist, dass Zusammenhänge zwischen vielen Variablen untersucht werden können. In einem Experiment werden dagegen in der Regel nur wenige unabhängige und abhängige Variable berücksichtigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist der Nachteil von Korrelationsstudien?

A

Verfahren zur Analyse von Zusammenhängen kommen in der sozialwissenschaftlichen Forschung (z.B. Soziologie, Politologie, Psychologie) aus den genannten Gründen häufiger zum Einsatz als die experimentelle Methode, sie haben allerdings einen entscheidenden Nachteil: Korrelative Zusammenhänge dürfen nicht kausal interpretiert werden; es ist lediglich möglich, durch bestimmte korrelative Designs (Längsschnittstudien und insbesondere cross-lagged panel designs, s.u.) und/oder inhaltliche Überlegungen die Anzahl kausaler Erklärungsalternativen einzuschränken bzw. zu falsifizieren. Jedoch hängt die Frage nach der kausalen Interpretierbarkeit korrelativer Zusammenhänge auch vom zugrundeliegenden Kausalitätskonzept ab (vgl. Abschnitt 7.6). Korrelative Zusammenhänge sind zudem nicht deterministisch, wie viele funktionale Zusammenhänge, die z.B. in der Physik ermittelt wurden, sondern lediglich stochastisch (zufallsabhängig) und damit nur mit einer gewissen Wahrscheinlichkeit zutreffend.

Um Missverständnisse zu vermeiden, sei gleich an dieser Stelle darauf hingewiesen, dass Korrelationsforschung nicht auf eine einzige statistische Prozedur beschränkt ist, etwa den Bravais-Pearson Korrelationskoeffizienten. Auch regressions-und- faktorenanalytische Analyseverfahren (s.u.) zählen zur Korrelationsforschung, denn auch damit werden bestimmte Arten von Zusammenhängen ermittelt. Die statistischen Verfahren zur Untersuchung und Überprüfung von Zusammenhängen werden insbesondere im Modul 2, aber auch im Modul 6 und 7 vermittelt. In diesem Abschnitt wird lediglich ein inhaltlicher, weitgehend nicht-technischer Überblick zu verschiedenen korrelativen Designs bzw. Zusammenhangshypothesen gegeben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was sind Bivariate Zusammenhangshypothesen?

A

Bivariate Zusammenhangshypothesen betreffen vermutete Assoziationen zwischen zwei Merkmalen. Gibt es z.B. einen Zusammenhang zwischen dem Alter und der durchschnittlichen Internetnutzungszeit pro Woche? Diese Fragestellung lässt sich je nach Vorwissen (bzw. in anderen Fällen theoretisch begründet) als ungerichtete oder gerichtete Zusammenhangshypothese formulieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist der Unterschied zwischen gerichteten und ungerichteten Zusammenhangshypothesen?

A

Ungerichtete Zusammenhangshypothesen nehmen lediglich eine Assoziation zwischen zwei Merkmalen an und spezifizieren nicht, ob es sich dabei um einen negativen oder positiven Zusammenhang handelt, in unserem Beispiel: das Alter und die Internetnutzung hängen zusammen. Gerichtete Zusammenhangshypothesen spezifizieren dagegen die Richtung der Assoziation, z.B. Das Alter hängt negativ mit der durchschnittlichen Internetnutungszeit zusammen oder anders formuliert: Höheres Alter geht mit niedrigerer Internetnutzung einher. Die Richtung des Zusammenhangs kann auch positiv formuliert werden, in unserem Fall würde die Hypothese dann lauten: Höheres Alter geht mit höherer Internetnutzung einher.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wie kann man bivariate Zusammenhangshypothesen untersuchen?

A
Um bivariate (ungerichtete oder gerichtete) Zusammenhangshypothese untersuchen zu können, müssen die beiden Merkmale an einer größeren, möglichst repräsentativen Stichprobe erhoben werden (die durchschnittliche Internetnutzungszeit lässt sich einfach, aber relativ ungenau per Selbsturteil einschätzen). Pro Person oder Merkmalsträger würden dann zwei Messwerte resultieren und für die gesamte Stichprobe zwei Messwerte-Reihen mit eindeutig einander zuordenbaren Messwerten.
 Mit Hilfe eines Korrelationskoeffizienten lässt sich nun ermitteln, in welchem Ausmaß die beiden Merkmale Alter und durchschnittliche Internetnutzungszeit pro Woche gemeinsam variieren bzw. kovariieren. Die Kovariation lässt sich als Art des Zusammenhangs beschreiben: Ein positiver oder negativer linearer Zusammenhang ist der Fall, wenn hohe Ausprägungen des einen Merkmals mit hohen bzw. niedrigeren Ausprägungen des anderen Merkmals assoziiert sind, z.B. je höher das Alter desto niedriger die durchschnittliche Internetnutzungszeit (negativer linearer Zusammenhang).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wann liegt ein nicht-linearer Zusammenhang vor?

A

Ein nicht-linearer Zusammenhang würde z.B. vorliegen, wenn die durchschnittliche Internetnutzungszeit bis zu einem bestimmten Alter abnimmt, im höheren Erwachsenenalter dann aber wieder zunimmt. Eine mögliche Erklärung für diesen fiktiven und konstruierten nicht-linearen Zusammenhang könnte sein, dass Personen im höheren Lebensalter zunehmend mehr das Internet als Kommunikationsmedium für sich entdecken und es besonders intensiv nutzen können, da ihnen viel freie Zeit zur Verfügung steht (sogenannte silver surfer). Ein empirisch gesicherter nicht-linearer Zusammenhang ist das Yerkes-Dodson-Gesetz (Yerkes & Dodson, 1908), nach dem die Produktivität bis zu einem mittleren Erregungsniveau kontinuierlich ansteigt, mit höheren Erregungsniveaus dann aber abnimmt (umgekehrt U-förmiger Zusammenhang, vgl. Abbildung 7-3).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was läßt sich alles in Zusammenhangshypothesen bestimmen?

A

Neben der Art des Zusammenhangs (linear vs. nicht-linear) lässt sich noch die Richtung (positiv oder negativ) und die Intensität bzw. Enge bestimmen. Korrelationskoeffizienten können Werte zwischen + 1 und – 1 annehmen. Je höher der Betrag des Koeffizienten desto enger der (positive oder negative) Zusammenhang zwischen 2 Merkmalen. Wird ein Korrelationskoeffizient von + 1 oder – 1 ermittelt, dann liegt ein perfekter linearer und damit nicht mehr stochastischer, sondern deterministischer Zusammenhang vor. Die Ausprägungen des einen Merkmals lassen sich dann bei Kenntnis der Ausprägungen des anderen Merkmals perfekt vorhersagen (über eine lineare Regressionsgleichung, vgl. Modul 2 bzw. nächster Abschnitt). Derart hohe Korrelationen kommen empirisch in der Psychologie aus verschiedenen Gründen so gut wie nie vor, da Erleben und Verhalten immer mit multiplen Bedingungen assoziiert ist, die zudem in Wechselwirkung treten können (vgl. nächster Abschnitt). Abgesehen davon mindern Fehler bei der Messung der interessierenden Merkmale die Enge des Zusammenhangs (vgl. hierzu noch ausführlicher Modul 6, Kurs Testkonstruktion). Nach Konventionen von Cohen (1988) können Korrelationen um +/.10 als schwache Zusammenhänge, um +/. 30 als mittlere Zusammenhänge und um +/.50 als starke Zusammenhänge interpretiert werden. Eine Korrelation von +/.50 zwischen zwei Merkmalen ist noch weit von einem perfekten Zusammenhang entfernt, gilt in der Psychologie aber wegen der multiplen Bedingtheit des Erlebens und Verhaltens schon als starker Zusammenhang.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Wovon hängt es ab, welcher Korrelationskoeffizient herangezogen werden kann?

A

Welcher Korrelationskoeffizient herangezogen werden kann, hängt vom Skalenniveau der erfassten Merkmale ab. In Tabelle 7-4 werden die Korrelationskoeffizienten in Abhängigkeit vom Skalenniveau lediglich aufgelistet; genauere Informationen erhalten Sie im Modul 2. Unterstellt man in unserem Beispiel den Selbsteinschätzungen der Internetnutzungszeit Intervallskalen-Niveau (was sicher nicht unproblematisch ist), dann kann die Bravais-Pearson-Produkt-MomentKorrelation berechnet werden.

Tab. 7-4: Bivariaten Korrelationsarten:

|| Merkmal y Merkmal x
|| | Intervallskala | Dichotomes Merkmal | Ordinalskala
|| Intervallskala | Produkt-MomentKorrelation | Punktbiseriale Korrelation | Rangkorrelation
|| Dichotomes Merkmal | | Φ -Koeffizient | Biseriale Rangkorrelation
|| Ordinalskala | | | Rangkorrelation

Bei dem angeführten Beispiel zum Lebensalter und dem Ausmaß der Internetnutzung handelt es sich um ein korrelatives Querschnittdesign, bei dem die Erhebung der Merkmalsausprägungen nur zu einem bestimmten Messzeitpunkt erfolgt (Genaueres zu Querschnittdesigns erfahren sie im Modul 4 zur Entwicklungspsychologie).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wie sieht ein Länggsschnittdesign im bivariaten Fall aus?

A

In einem Längsschnittdesign würde im bivariaten Fall ein und dasselbe Merkmal bei allen Personen einer Stichprobe zu zwei verschiedenen Messzeitpunkten erhoben werden. Dieses Design kommt in der Differentiellen Psychologie und Persönlichkeitsforschung zum Einsatz, wenn die zeitliche Stabilität von Eigenschaften, z.B. Gewissenhaftigkeit, ermittelt werden soll. Eigenschaften als habituelle Erlebens- und Verhaltenstendenzen müssen empirisch u.a. eine Stabilität über die Zeit aufweisen. Um diese zeitliche Stabilität bestimmen zu können, wird eine Retest-Korrelation zwischen den Ausprägungen eines Merkmals bei einer Stichprobe von Personen zum Zeitpunkt t1 und den Ausprägungen desselben Merkmals zum Zeitpunkt t2 ermittelt (die Ausprägungen des Merkmals Gewissenhaftigkeit werden z.B. durch einen geeigneten Fragebogen im Selbstoder Fremdurteil erhoben). Die resultierende Korrelation betrifft die differentielle Stabilität des Merkmals, d.h. die zeitliche Stabilität interindividueller Unterschiede. Differentielle Stabilität meint das „Verharren“ von Personen auf denselben relativen Positionen innerhalb einer Gruppe über die Zeit.

24
Q

Bivariate Zusammenhangshypothesen, nomothetische und idiographische Anwendungsfälle, ipsative Stabilität. Gesundheit.

A

Wer zum Zeitpunkt t1 einen Wert für Gewissenhaftigkeit aufwies, der im Vergleich zu den meisten anderen Probanden in der Stichprobe höher (niedriger) war, der oder die sollte auch zum Zeitpunkt t2 einen höheren (niedrigeren) Wert aufweisen als die meisten anderen Probanden. Die hier beschriebene Retestkorrelation betrifft den nomothetischen Anwendungsfall, d.h. es wird festgestellt, ob die Rangordnung von mehreren Personen einer Stichprobe in Bezug auf ein Merkmal über die Zeit gleich bleibt oder sich verändert.
In der idiographischen Variante wird nicht über Personen sondern über mehrere Merkmale innerhalb einer Person korreliert (Q-Korrelation, vgl. Stephenson, 1952; Cronbach & Gleser, 1953). Es geht dabei also um die Stabilität bzw. Veränderung der relativen Positionen von Merkmalen innerhalb eines individuellen Variablen-Profils. Dabei handelt es sich um eine Form von ipsativer Stabilität, die als ipsativ-differentiell bezeichnet werden könnte: „Ipsativ“, weil es um die Stabilität bei einer Person geht, und „differentiell“, weil wie im nomothetischen Anwendungsfall das „Verharren“ nicht von Personen, aber von Profilmerkmalen auf denselben Positionen über die Zeit bestimmt wird (vgl. Renner, 2002).

25
Q

Was ist die (informale) Motivation, multivariate Zusammenhangshypothesen zu erforschen?

A

Unsere bisher formulierte bivariate Hypothese zum Zusammenhang zwischen Alter und Internetnutzung ist sehr einfach; zu einfach, denn Erleben und Verhalten hängt immer von vielen verschiedenen Merkmalen und Bedingungen ab, die u.U. miteinander interagieren können. Auch für die durchschnittliche Internetnutzungszeit pro Woche sind sicherlich mehr Bedingungen von Bedeutung als nur das Alter. Das Geschlecht, der Bildungsstand, der berufliche und sozioökonomische Status, der Wohnort (Stadt vs. Land und damit Zugang zu DSL oder nicht) und auch Persönlichkeitsmerkmale können mit der durchschnittlichen Internetnutzungszeit assoziiert sein. Auch die Internetnutzung selbst lässt sich vielfältiger beschreiben und erfassen als lediglich durch die durchschnittliche Nutzungszeit pro Woche: Welche Internetdienste werden wie lange genutzt? Soll zwischen beruflicher und privater Internetnutzung unterschieden werden?

26
Q

Erkläre die Unterscheidung zwischen Prädiktoren und Kriterien!

A

Wenn der Zusammenhang zwischen mehreren Merkmalen zu einem oder mehreren weiteren Merkmal(en) untersucht werden soll, dann wird formal zwischen Prädiktoren, also Vorhersage-Variablen, und Kriterien, die vorhergesagt werden sollen, unterschieden. Diese Unterscheidung macht besonders dann Sinn, wenn das oder die Kriterien zeitlich gesehen nach der Erfassung der Prädiktoren erhoben werden. In der psychologischen Internetforschung ist dieses methodische Prinzip u. a. in den Studien von Kraut und Mitarbeitern (Kraut, Lundmark, Kiesler, Mukhopadhyay & Scherlis, 1998) umgesetzt worden. Die Autoren erfassten zuerst mehrere Prädiktorvariablen bei einer Stichprobe von Personen aus der Unterschicht und stellten den Probanden dann kostenlos Rechner mit Internetzugang zur Verfügung. Die Internetnutzung wurde online protokolliert, d.h. die Versuchsleiter beobachteten über log-Dateien, wie oft, wie lange und welche Dienste die Probanden im Internet in Anspruch genommen haben. Diese Methode hat gegenüber den oben angedeuteten Selbsteinschätzungen der Internernutzung entscheidende Vorteile, lässt sich aber unter ethischen Gesichtspunkten kontrovers diskutieren (vgl. Kapitel 8). Die Unterscheidung zwischen Prädiktoren und Kriterien entspricht der Unterscheidung zwischen unabhängigen und abhängigen Variablen im Experiment. In einigen Lehrbüchern (z.B. Cohen, Cohen, West & Aiken, 2003) wird auch in korrelativen Designs von UVs und AVs gesprochen. Wir bevorzugen allerdings die Begriffe Prädiktor und Kriterium, um nicht Gefahr zu laufen, die im Experiment mögliche Manipulation der UV und die Möglichkeit zur Prüfung von Kausalhypothesen stillschweigend auch für die Korrelationsforschung zu implizieren.

27
Q

Normalerweise geht es um einen in der Forschungspraxis sehr häufigen Anwendungsfall, bei dem mehrere Prädiktoren zur Vorhersage eines Kriteriums herangezogen werden. Was wäre ein anderer Fall?

A

Ein sich systematisch anschließender Fall, der hier nur erwähnt wird, betrifft den sogenannten kanonischen Zusammenhang eines Sets aus mehreren Prädiktoren mit einem Set aus mehreren Kriterien. Statistisch wird diese Form des Zusammenhangs mit Hilfe der kanonischen Korrelation ermittelt (vgl. Modul 2).

28
Q

Was heißt “multivariat”?

A

Der Begriff „multivariat“ wird in Statistikund Methodenlehrbüchern nicht ganz konsistent verwendet. Im Zusammenhang mit Experimenten und varianzanalytischen Methoden bedeutet „multivariat“, dass mehrere abhängige Variable untersucht werden. Die Berücksichtigung mehrerer unabhängiger Variablen wird dagegen mehrfaktoriell, aber immer noch univariat genannt. In der Korrelationsund Regressionsrechnung wird dagegen auch die multiple Regressionsanalyse (mehrere Prädiktoren, ein Kriterium) den multivariaten Methoden (vgl. Z.B. Bortz, 2005) bzw. den multivariaten Zusammenhangshypothesen (Bortz & Döring, 2006) zugeordnet. Wir folgen in diesem Abschnitt dieser Konvention, obwohl eigentlich nur kanonische Zusammenhänge multivariat bezeichnet werden könnten, wenn die Unterscheidung zwischen univariaten und multivariaten Methoden aus der experimentellen und varianzanalytischen Vorgehensweise beibehalten werden würde.

29
Q

Was ist die Grundidee der multiplen Regressionsrechnung?

A

In der Psychologie werden häufig Zusammenhänge zwischen mehreren Prädiktoren und einem Kriterium untersucht. Zur Veranschaulichung greifen wir noch einmal auf unser Internetbeispiel zurück: Wie hängen das Geschlecht, der Bildungsstand, der berufliche und sozioökonomische Status, der Wohnort und Persönlichkeitsmerkmale mit der durchschnittlichen Internetnutzungszeit zusammen? Nachdem mit geeigneten Methoden Daten zu den genannten Prädiktoren und zum Kriterium erhoben wurden, lässt sich diese Zusammenhangshypothese mit Hilfe der multiplen Regressionsrechnung analysieren (vgl. Modul 2). Das Ergebnis einer multiplen Regressionsanalyse ist eine Gleichung zur Vorhersage der Kriteriumswerte und der multiple Korrelationskoeffizient, der den Zusammenhang zwischen den vorhergesagten und den tatsächlichen Kriteriumswerten quantifiziert.

30
Q

Warum werden eigentlich nicht mehrere bivariate Korrelationen berechnet, um den Zusammenhang zwischen den Prädiktoren und dem Kriterium zu bestimmen? Nenne drei Gründe!

A
  1. Erstens lässt sich eine multiple Regressionsanalyse so durchführen, dass aus einer Vielzahl von Prädiktoren diejenigen bestimmt werden können, die zur Vorhersage des Kriteriums einen substantiellen Beitrag leisten. Anders ausgedrückt lassen sich Prädiktoren identifizieren, die im Kontext der multiplen Vorhersage redundant sind, obwohl sie eine bivariate Korrelation mit dem Kriterium aufweisen. Diese Redundanz kann resultieren, wenn die Prädiktoren untereinander korrelieren und damit ähnliche Merkmalsanteile erfassen, was z.B. für den Bildungsstand und den sozio-ökonomischen Status der Fall ist oder auch für Persönlichkeitsmerkmale wie soziale Ängstlichkeit und Selbstwertschätzung (deutliche negative Korrelation). Wenn die Prädiktoren zu hoch interkorrelieren, dann ist die Validität der Regressionsanalyse u.U. sogar gefährdet (Problem der Multikollinearität, vgl. Modul 2); deswegen sollten die Prädiktoren idealerweise linear unabhängig sein, was empirisch jedoch oft nicht der Fall ist. Ein Beispiel für den Einsatz der multiplen Regressionsanalyse zur Vorhersage der Internetnutzung finden Sie bei Wolfradt und Doll (2005). Die beiden Autoren haben verschiedene Persönlichkeitsmerkmale und das Geschlecht als Prädiktoren für verschiedene Arten der Internetnutzung untersucht. Dabei resultierte u.a., dass die instrumentellunterhaltungsorientierte Internetnutzung (z.B. Musik und Filme downloaden, die Homepage von Freunden besuchen, online-shopping) bei den männlichen Befragten durch hohe Werte in Extraversion und Offenheit für neue Erfahrungen vorhergesagt werden kann.

  1. Zweitens können Interaktionseffekte zwischen den unterschiedlichen Prädiktoren bestimmt und damit das gemeinsame Zusammenwirken zweier Merkmale auf das Kriterium untersucht werden. In der multiplen Regressionsanalyse werden solche Interaktionen im Rahmen von sogenannten Moderator-Hypothesen geprüft (moderierte Regression, vgl. Abschnitt 7.4.3.2).
  2. Drittens können in einer multiplen Regressionsanalyse manchmal sogenannte Suppressionseffekte auftreten.
31
Q

Was sind Suppressionseffekte?

A

Bei einem Suppressor handelt es sich um eine Prädiktorvariable, die den Vorhersagebeitrag einer (oder mehrerer) anderer Variablen erhöht, in dem sie für die Vorhersage irrelevante Varianzanteile unterdrückt.
Ein Beispiel für einen replizierbaren Suppressionseffekt stammt von Paulhus, Robins, Trzesniewski und Tracy (2004). Die Autoren konnten zeigen, dass bei der Vorhersage von anti-sozialem Verhalten sogenannte reziproke bzw. kooperative Suppressionseffekte (vgl. Bortz, 2005, Cohen & Cohen, 1975) auftreten, wenn Narzissmus und Selbstwertschätzung gemeinsam als Prädiktoren in die Regressionsgleichung eingegeben werden. Narzissmus korreliert für sich genommen positiv mit antisozialem Verhalten; Selbstwertschätzung weist dagegen ein inkonsistentes Muster über mehrere Studien hinweg auf: in einigen Studien korreliert die Selbstwertschätzung gar nicht, in anderen leicht positiv und in wieder anderen Studien leicht negativ mit antisozialem Verhalten. Werden Narzissmus und Selbstwertschätzung gemeinsam in einer Regressionsanalyse zur Vorhersage von antisozialem Verhalten eingegeben, so zeigt sich ein konsistent negativer Zusammenhang zwischen Selbstwertschätzung und anti-sozialem Verhalten und ein positiverer Zusammenhang zwischen Narzissmus und antisozialem Verhalten als bei der bivariaten Korrelation.

32
Q

Wie lässt sich diese wechselseitige Verbesserung der Prädiktionsleistung erklären?

A

Zunächst ist zu beachten, dass Narzissmus und Selbstwertschätzung schon auf theoretischer Ebene überlappen: Narzissmus wird als besonders hohe (grandiose), aber fragile Selbstwertschätzung expliziert, während Selbstwertschätzung neutraler als positive oder negative Bewertung der eigenen Person definiert wird. Anders ausgedrückt werden Personen mit hohen Narzissmusausprägungen auch solche Items bejahen, die zur Erfassung normaler positiver Selbstwertschätzung dienen, wie z.B. „Haben Sie eine positive Einstellung zu sich selbst?“. Andererseits mag es auch Narzissmus-Items geben, die von Personen mit normaler positiver Selbstwertschätzung bejaht werden können, wie z.B. „Ich will erfolgreich sein“. Die Erfassung des Merkmals Selbstwertschätzung ist mit der Erfassung von Narzissmus „konfundiert“. Wenn nun Summenscores für Selbstwertschätzung alleine mit antisozialem Verhalten korreliert werden, dann können die mit der Selbstwertschätzung erfassten Narzissmus-Anteile dazu führen, dass manchmal sogar eine leicht positive Korrelation resultiert. Wenn beide Merkmale gemeinsam in eine Regressionsgleichung eingegeben werden, tritt eine gegenseitige Unterdrückung (Suppression) der jeweils irrelevanten Varianzanteile auf, die zu einer Erhöhung des negativen bzw. positiven Zusammenhangs von Selbstwertschätzung bzw. Narzissmus mit antisozialem Verhalten führt. Würde man nur bivariate Korrelationen berücksichtigen, dann könnten solche Suppressionseffekte nicht aufgedeckt werden.

33
Q

Was sind Moderator-Hypothesen?

A

Erleben und Verhalten ist multideterminiert und deshalb kovariiert ein Kriterium wie die Internetnutzung mit vielen unterschiedlichen Prädiktoren. Im vorherigen Abschnitt wurde bereits angedeutet, dass Interaktionseffekte zwischen den Prädiktoren bestimmt und damit das gemeinsame Zusammenwirken von in der Regel zwei Merkmalen auf das Kriterium untersucht werden kann. In der multiplen Regressionsanalyse werden solche Interaktionen im Rahmen von sogenannten Moderator-Hypothesen untersucht. Ein Moderator ist eine qualitative (z. B. Geschlecht, Schichtzugehörigkeit) oder quantitative (z.B. Ausprägungen eines Persönlichkeitsmerkmals) Variable, die die Richtung und/oder die Enge des Zusammenhangs zwischen einer Prädiktor-Variable und einer Kriteriumsvariable beeinflusst (Baron & Kenny, 1986). Anders ausgedrückt liegt ein Moderatoreffekt dann vor, wenn die Beziehung zwischen zwei Variablen von der Ausprägung einer dritten Variable abhängt (vgl. Abbildung 7-4: Prädiktor–>Kriterium; Moderator hat Einfluß auf den Zusammenhang).

34
Q

Nenne ein Beispiel für einen Moderatoreffekt!

A

Als Beispiel kann noch einmal der oben bereits skizzierte Befund von Wolfradt und Doll (2005) herangezogen werden: Der Zusammenhang zwischen Extraversion bzw. Offenheit für Erfahrung und der unterhaltungsorientierten Internetnutzung gilt nämlich nur für Männer, nicht aber für Frauen. Anders ausgedrückt moderiert das Geschlecht den Zusammenhang zwischen den genannten Variablen. Nur wenn die Geschlechtsausprägung „männlich“ vorliegt, findet sich ein positiver Zusammenhang.

35
Q

Wiederhole Wort für Wort den Statistisch-technischen Exkurs!

A

Die nachfolgenden Angaben werden der Vollständigkeit halber angeführt, müssen aber im Zusammenhang mit Modul 2 (Kurs Statistik II) gelesen werden, um verstanden werden zu können. Eine ModeratorHypothese lässt sich in einem experimentellen Design prüfen, indem die Interaktion zwischen zwei Faktoren geprüft wird (vgl. Modul 2). Im korrelativen Ansatz erfolgt die Überprüfung einer Moderator-Hypothese in einer hierarchischen, moderierten Regression (vgl. Modul 2, Varianzanalyse). Hierarchisch bedeutet, dass in drei Schritten zunächst der Prädiktor, dann zusätzlich der Moderator und im dritten Schritt auch noch ein Produktterm aus dem Prädiktor und Moderator eingegeben werden. Leistet der Produktterm, mit dem der Moderatoreffekt geprüft wird, einen zusätzlichen signifikanten Beitrag zur Vorhersage des Kriteriums, dann kann die Moderatorwirkung in sogenannten simple-slope-Analysen genauer untersucht werden. Dabei werden Regressionsgeraden des Kriteriums auf den Prädiktor bei hohen, durchschnittlichen und niedrigen Ausprägungen eines Moderators bestimmt und es wird getestet, ob die jeweilige Steigung von Null verschieden ist.

36
Q

Was ist eine Mediator-Variable?

A

Während eine Moderator-Variable spezifiziert, unter welchen Bedingungen welche Art des Zusammenhangs zwischen zwei Variablen besteht, erklärt eine Mediator-Variable den Prozess oder „Mechanismus“, durch den eine Prädiktorvariable eine Kriteriumsvariable „beeinflusst“ (MacKinnon, Fairchild & Fritz, 2007). Anders ausgedrückt ist ein Mediator eine quantitative oder qualitative Variable, die erklärt, warum ein Zusammenhang zwischen zwei anderen Variablen besteht. Damit verbunden ist die Idee einer Abfolge von Beziehungen, bei der eine Prädiktorvariable eine Mediatorvariable beeinflusst (vgl. Pfad a in Abbildung 7-5), die dann wiederum eine Kriteriumsvariable (Pfad b) beeinflusst. Durch die Mediation wird der Zusammenhang zwischen Prädiktor und Kriterium (Pfad c) erklärt.

Abb. 7-5: Mediatoreffekt: Prädiktor –a–> Mediator –b–>Kriterium. Aber auch: Prädiktor –c–> Kriterium

37
Q

Beschreibe das SO-R-Modell!

A

In der Psychologie lässt sich die Idee der Mediation mit dem sehr verbreiteten SO-R-Modell, das erstmals von Woodworth (1928) formuliert und später insbesondere im kognitionspsychologischen Paradigma aufgegriffen und ausgearbeitet wurde veranschaulichen. Demnach resultiert die Reaktion (R) auf einen externen Reiz bzw. Stimulus (S) aufgrund zahlreicher intervenierender Verarbeitungsprozesse innerhalb eines aktiven Organismus (O).

38
Q

Gib ein Beispiel für einen Mediatoreffekt!

A

In der persönlichkeitspsychologisch orientierten Internetforschung haben Hertel, Schroer, Batinic, Konradt und Naumann (2005, in press) einen Mediator für den Zusammenhang zwischen emotionaler Labilität (Neurotizismus) und der Präferenz für asynchrone Medien (z.B. E-Mail) identifizieren können, der insbesondere bei ambivalenten Kommunikationsanlässen auftritt, also z.B. wenn Konflikte oder Meinungsverschiedenheiten ausgetragen werden sollen. Die Bedingung Kommunikationsanlass ambivalent vs. nicht ambivalent moderiert also den genannten Zusammenhang! Warum aber bevorzugen emotional labile Personen bei ambivalenten Kommunikationsanlässen eher asynchrone Medien? Emotional labile Personen sind u.a. durch soziale Ängstlichkeit gekennzeichnet und werden deshalb in schwierigen sozialen Interaktionen besonders versuchen, ihre Unsicherheit zu reduzieren und die Kontrolle über die Situation zu erhöhen. Dies ist mit e-mail-basierter Kommunikation eher möglich, da hierbei kein direkter Austausch von Angesicht zu Angesicht stattfindet und genauer und länger überlegt werden kann, was zum Ausdruck gebracht werden soll und wie. Die soziale Angst und die damit verbundene Tendenz zur Reduktion von Unsicherheit fungieren demnach als Mediatoren des Zusammenhangs zwischen emotionaler Labilität und der Präferenz für asynchrone Medien bei ambivalenten Kommunikationsanlässen (vgl. Abbildung 7-6).
Mediator: soziale Angst / Reduktion von Unsicherheit
Prädiktor: Emotionale Labilität
Kriterium: Präferenz für asynchrone Medien

39
Q

Statistisch-technischer Exkurs

A

Die nachfolgenden Angaben werden der Vollständigkeit halber angeführt, müssen aber im Zusammenhang mit Modul 2 (Kurs Statistik II) gelesen werden, um verstanden werden zu können. Ein relativ einfaches Vorgehen, mit dem sich eine Mediator-Hypothese statistisch prüfen lässt, haben Baron und Kenny (1986, p. 1176) vorgeschlagen (es gibt noch andere, weitaus komplexere Verfahren). Demnach müssen folgende Bedingungen erfüllt sein, damit eine Mediatorhypothese angenommen wird: (1) der Prädiktor ist mit dem angenommenen Mediator korreliert (Pfad a in Abb. 7-6), (2) der potenzielle Mediator ist mit dem Kriterium korreliert (Pfad b), (3) wenn die Pfade (a) und (b) kontrolliert werden, verringert sich die Korrelation zwischen Prädiktor und Kriterium und wird bei vollständiger Mediation Null. Diese Bedingungen können im Rahmen von drei Regressionsgleichungen geprüft werden: (1) Regression des Mediators auf den Prädiktor, (2) Regression des Kriteriums auf den Prädiktor und (3) Regression des Kriteriums auf den Prädiktor und den Mediator. Mediation liegt vor, wenn der Effekt des Prädiktors auf das Kriterium in Gleichung 3 geringer ist als in Gleichung 2. Bei vollständiger Mediation ist der Effekt des Prädiktors in Gleichung 3 Null. Bei diesem Vorgehen werden u.a. sogenannte Partialregressionskoeffizienten bestimmt (vgl. Modul 2, Multiple Regression).

Das Konzept der Mediation ist zudem in partiellen Zusammenhangshypothesen impliziert (vgl. Bortz & Döring, 2006, S. 510f), die besagen, dass der Zusammenhang zwischen zwei Variablen X und Y unbedeutend wird, wenn man den „Einfluss“ einer dritten Variablen Z „ausschaltet“. Anders ausgedrückt wird der Zusammenhang zwischen X und Y um den Einfluss von Z bereinigt. Das statistische Verfahren zur Bestimmung und Prüfung solcher partiellen Zusammenhangshypothesen ist die Partialkorrelation (vgl. Modul 2 und einige Beispiele bei Bortz & Döring, 2006, S. 510f).

40
Q

Erkläre die Unterscheidung zwischen Moderatoren und Mediatoren in der psychologischen Stressforschung!

A

Die Unterscheidung zwischen Moderatoren und Mediatoren spielt auch in der psychologischen Stressforschung eine große Rolle (vgl. zusammenfassend Matthews, Deary & Whiteman, 2003, p. 255ff). So kann der Zusammenhang zwischen kritischen Lebensereignissen (z.B. Tod einer nahestehenden Person) und Depression durch soziale Unterstützung moderiert werden. Bei hoher sozialer Unterstützung ist der Zusammenhang niedrig, bei geringer sozialer Unterstützung kann der Zusammenhang dagegen hoch ausfallen. Der in vielen Studien nachgewiesene Zusammenhang zwischen dem Persönlichkeitsmerkmal Neurotizismus (emotionale Labilität) und Stress-Symptomen (z.B. Angst, Niedergeschlagenheit, physiologische Symptome) wird mit mediierenden dysfunktionalen Bewertungsund Bewältigungsprozessen erklärt. So neigen emotional labile Personen dazu potentielle Stressoren, wie z.B. eine Prüfung, als bedrohlicher wahrzunehmen als emotional stabile Personen, zudem schätzen sie ihre Bewältigungs- und Leistungsfähigkeiten niedrig ein.

41
Q

Wann werden Moderatoren in der Forschung gesucht?

A

In der empirisch-psychologischen Forschung werden Moderatoren typischerweise dann gesucht, wenn zwischen eine Prädiktor- und einer Kriteriumsvariable unerwartet niedrige oder inkonsistente Zusammenhänge resultierten, d.h. wenn ein Zusammenhang in unterschiedlichen Stichproben bzw. Populationen unterschiedlich ausfällt. Mediatoren werden dagegen insbesondere dann analysiert, wenn deutliche und gesicherte Zusammenhänge zwischen zwei Variablen bestehen (Baron & Kenny, 1986, p. 1178).

42
Q

Im Abschnitt 7 zu den Methoden der Datenerhebung wurde bei der Beschreibung der Fragebogen-Methode darauf hingewiesen, dass einzelne Fragen in der Regel nicht für sich ausgewertet und interpretiert, sondern die Antworten auf eine größere Zahl von Fragen oder Feststellungen nach bestimmten statistischen Prinzipien in einem einzigen Messwert zusammengefasst werden. Wie kommt man nun darauf, bestimmte Items (d.h. Testaufgaben oder Fragen bzw. die Antworten darauf) zu einem Gesamtwert zusammenzufassen? Unter welchen Bedingungen ist es gerechtfertigt, mehrere Items zu einem Gesamt-Score zu kombinieren?

A

Es erscheint zunächst unabhängig von statistischen Erwägungen sinnvoll, solche Items zusammenzufassen, die „irgendwie dasgleiche“ messen. Um statistisch feststellen zu können, was „irgendwie dasgleiche“ sein könnte, ist die Durchführung einer explorativen Faktorenanalyse indiziert. Die mit einer Faktorenanalyse verbundene Hypothese ist, dass sich die wechselseitigen Zusammenhänge vieler beobachteter bzw. gemessener Variablen durch wenige, in der Regel voneinander unabhängige (orthogonale) Faktoren bzw. Dimensionen erklären lassen. Viele miteinander korrelierende Variablen werden somit auf wenige, voneinander unabhängige Faktoren reduziert; die Faktoren werden auch als latente Variablen bezeichnet – und als hypothetische Konstrukte, wenn sie inhaltlich sinvoll sind.

43
Q

Die Reduktion einer großen Datenmenge, z.B. der Einschätzungen auf und Korrelationen zwischen 50 oder noch mehr Items auf wenige, z.B. 3 – 4 Faktoren ist mit mindestens zwei Vorteilen verbunden - welche sind das?

A

(1) Wenige Dimensionen können leichter weiterverarbeitet und kommuniziert werden. Stellen Sie sich vor, Sie würden die Einschätzungen auf den 50 Items als einzelne Prädiktoren zur Vorhersage des Kriteriums Internetnutzung heranziehen. Ein solches Vorgehen macht wenig Sinn, insbesondere wenn viele der 50 Items redundant sind, d.h. hoch untereinander und mit dem Kriterium korrelieren.
(2) Ein noch wichtigeres Argument für die Identifikation von Faktoren ist die damit verbundene Möglichkeit, Messungen zu aggregieren, d.h. zu einem Wert zusammenzufassen. Nach dem Aggregationsprinzip liefert die Summe mehrerer (miteinander korrelierender) Messungen eine stabilere und repräsentativere Schätzung eines Merkmals als eine einzelne Messung (Rushton, Brainerd & Pressley, 1983). Die höhere Messgenauigkeit mehrerer Messungen hängt damit zusammen, dass einzelne Messungen immer fehlerbehaftet sind. Wenn viele Messungen miteinander kombiniert werden, gleichen sich die Fehler dagegen aus. Eine Analogie aus dem nicht psychologischen Bereich macht dieses Prinzip vielleicht deutlicher: Wenn Sie die Länge eines Tisches möglichst genau messen wollen, dann ist es günstiger anstelle einer einzigen Messung 10 Messungen durchzuführen und einen Mittelwert zu bilden. Wenn Prädiktoren und auch Kriterien genau gemessen werden können, dann lassen sich auch Zusammenhänge zwischen den gemessenen Merkmalen besser identifizieren.

44
Q

Was ist das Reliabilitäts-Validitäts-Dilemma?

A

Werden Merkmale sehr ungenau gemessen, dann kann es sein, dass sie nur sehr niedrig oder gar nicht interkorrelieren, obwohl ein Zusammenhang besteht, der bei höherer Messgenauigkeit aufgedeckt werden könnte. Allerdings kann die ausschließliche Orientierung an der Optimierung der Messgenauigkeit zu einer zu starken Homogenisierung eines Messinstruments führen; es wird dann ein nur sehr schmaler Merkmalsbereich erfasst und die Korrelationen mit anderen Variablen fallen dann auch wieder niedriger aus (sogenanntes Reliabilitäts-Validitäts-Dilemma, vgl. hierzu im Detail den Kurs Testkonstruktion im Modul 6).

45
Q

Wie „funktioniert“ eine Faktorenanalyse?

A

Im Folgenden soll eine ungefähre eher inhaltliche und formelfreie Beschreibung versucht werden, die darauf abzielt, dass Sie bestimmte Begriffe verstehen können, die Sie in der Originalliteratur häufig antreffen werden.
In der Faktorenanalyse werden Variablen anhand ihrer korrelativen Beziehungen in voneinander unabhängige Gruppen klassifiziert. Bestimmte Indexzahlen, sogenannte Ladungen, geben an, wie gut eine Variable zu einer Variablengruppe bzw. einem Faktor passt. Vereinfacht ausgedrückt sind Ladungen die Korrelationen einer einzelnen Variable (eines Items) mit einem Faktor. Je höher eine Variable/ein Item auf einem Faktor lädt, umso besser passt sie zu bzw. repräsentiert sie diesen Faktor. Diejenigen Items, die am höchsten auf einem Faktor laden, werden Markiervariablen genannt und zur Interpretation des Faktors herangezogen, also um inhaltlich auszudrücken, was ein Faktor erfasst.

46
Q

Was genau ist eigentlich ein Faktor (Kontext: Faktorenanalyse)?

A

Bei einer großen Menge von Items lassen sich Partialkorrelationen berechnen. Diese geben an, inwieweit die Korrelation zweier Variablen durch eine dritte gestiftet wird, was immer dann der Fall ist, wenn nach dem Herauspartialisieren die Korrelation zwischen den beiden Variablen praktisch unbedeutend wird. Ausgehend von den Korrelationen zwischen den gemessenen Variablen wird eine synthetische, latente Variable konstruiert, die mit allen Variablen so hoch wie möglich korreliert. Diese synthetische, latente Variable ist der Faktor. Wird der Faktor aus den Variablen herauspartialisiert, ergeben sich weitere Partialkorrelationen, die diejenigen Variablenzusammenhänge erfassen, die nicht durch den Faktor erklärt werden können. Zur Klärung dieser Restkorrelationen werden weitere, in der Regel voneinander unabhängige (orthogonale) Faktoren extrahiert. Das Ergebnis einer Faktorenanalyse sind wechselseitig voneinander unabhängige Faktoren, die die Zusammenhänge zwischen den jeweiligen Variablen erklären. Die inhaltliche Interpretation dieser Faktoren ist offen!

47
Q

Erkläre die Unterscheidung zwischen explorativen und konfirmatorischen Faktorenanalysen!

A

Eine explorative Faktorenanalyse ist ein heuristisches Verfahren, das einem Variablengeflecht eine Ordnung unterlegt, mit der sich die Variableninterkorrelationen erklären lassen. Insbesondere geht es um die Ermittlung der Anzahl der Faktoren. Es gibt jedoch nicht nur eine einzige Ordnung, die die Merkmalszusammenhänge erklärt. Deshalb muss der Forscher dasjenige Ordnungssystem herauszufinden, das sich nicht nur statistisch, sondern auch theoretisch am besten begründen lässt. Ist innerhalb einer gegebenen Menge von Variablen/Items mittels exploratorischer Faktorenanalyse eine Faktorenstruktur ermittelt worden, so kann in weiteren Studien geprüft werden, ob sich diese Faktorenstruktur auch in anderen Stichproben replizieren und bestätigen lässt. In einer konfirmatorischen Faktorenanalyse wird also die Hypothese geprüft, dass eine bestimmte Faktorenstruktur auch in weiteren Stichproben mit den gegebenen Variablen/Items gilt bzw. zutrifft.

48
Q

In der Einführung wurde bereits betont, dass korrelative Zusammenhänge nicht kausal interpretiert werden dürfen. Wie kann man dennoch die Anzahl kausaler Erklärungsalternativen einschränken?

A

Es besteht die Möglichkeit, durch bestimmte korrelative Designs (Längsschnittstudien und insbesondere cross-lagged panel designs, s.u.) und/oder inhaltliche Überlegungen die Anzahl kausaler Erklärungsalternativen einzuschränken bzw. zu falsifizieren (vgl. Bortz & Döring, 2006).

49
Q

Wenn zwischen zwei Variablen X und Y keine positive oder negative Korrelation festgestellt werden kann, dann ist – vorausgesetzt die Nullkorrelation ist nicht messfehlerbedingt – die Hypothese eines Kausalzusammenhangs zwischen X und Y falsifiziert. Was aber bedeutet es, wenn zwei Variablen, z.B. übermäßiger Alkoholkonsum (x) und die Lebenserwartung (y) negativ korrelieren? Bortz und Döring (2006, S. 518) unterscheiden sechs mögliche Kausalmodelle, die für die Interpretation dieses Zusammenhangs infrage kommen - nenne sie!

A

Modell a: Übermäßiger Alkoholkonsum reduziert die Lebenserwartung (x beeinflusst y).
Modell b: Eine geringe Lebenserwartung verursacht erhöhten Alkoholkonsum (y beeinflusst x)
Modell c: Übermäßiger Alkoholkonsum und eine geringe Lebenserwartung beeinflussen sich wechselseitig5.
Modell d: Durch erhöhten Alkoholkonsum wird man arbeitsunfähig und damit arm. Armut (z) bedingt schlechte Ernährung, die das Leben verkürzt (x beeinflusst eine dritte Variable z, die ihrerseits y beeinflusst;
z mediiert also den Zusammenhang zwischen x und y).
Modell e: Eine angeborene „Ich-Schwäche“ (z) erhöht die Anfälligkeit für lebensbedrohende Krankheiten und für Alkohol (x und y werden durch eine dritte Variable z beeinflusst).
Modell f: Stress (w) verursacht Trinken und Rauchen (z). Lebensverkürzend wirkt aber nur das Rauchen (eine vierte Variable w beeinflusst y über z indirekt und x direkt).

Bortz und Döring (2006) betonen selbst, dass diese Kausalmodelle unterschiedlich glaubwürdig und plausibel sind, was jedoch nicht aus der Korrelation selbst resultiert. In bestimmten Fällen lassen sich bestimmte Kausalinterpretationen von Korrelationen aber inhaltlich ausräumen. Wenn z.B. untersucht werden soll, ob die Jahreszeit, in der eine Person geboren wurde, mit dem späteren subjektiven Glücksempfinden zusammenhängt (vgl. Chotai & Wiseman, 2005), dann wird man logischerweise das kausale Erklärungsmodell „späteres Wohlbefinden beeinflusst früheren Geburtsmonat“ ausschließen. Man wird in diesem Fall aber auch keinen direkten Kausaleinfluss, sondern eher eine Mediation durch eine andere Variable vermuten (im zitierten Beispiel werden Persönlichkeitsmerkmale und Neurotransmitter als mögliche Mediatoren diskutiert).

50
Q

Wann kann man Längsschnittstudien durch Querschnittsstudien ersetzen?

A

Ähnlich wie in dem soeben angeführten Beispiel können auch in Längsschnittstudien bestimmte Kausalhypothesen a priori ausgeschlossen werden. So liegen z.B. zahlreiche Studien vor, in denen der Zusammenhang zwischen der Abiturnote und dem Studienerfolg untersucht wurde. Da die Abiturnote bereits vor entsprechenden Studienleistungen vorliegt, können die Studienleistungen natürlich nicht die Abiturnote beeinflussen. Streng genommen ist in diesem und auch in dem davor angeführten Beispiel ein Längsschnittdesign nicht notwendig, da sich weder die Abiturnote noch die Jahreszeit der Geburt im Nachhinein noch ändern können. Die relevanten Variablen können also auch in einem Querschnittdesign erhoben werden. Anders verhält es sich dagegen bei Variablen, die sich im Zeitverlauf verändern können, so etwa die Einstellung eines Lehrers gegenüber seinen Schülerinnen und Schülern. Wenn z.B. untersucht werden soll, ob diese Variable mit den Noten der Schüler zusammenhängt, dann muss die Lehrereinstellung am besten gleich zu Beginn des Schuljahres erfasst werden.

51
Q

Was ist das Cross-lagged panel design?

A

Die Möglichkeit, unterschiedliche Kausalmodelle in korrelativen Längsschnittstudien auszuschließen, wurde von Campbell (1963) in einem eigenen Versuchsplan „verfeinert“, dem sogenannten Cross-lagged panel design. In einem Cross-lagged panel design werden mindestens 2 Variablen zu 2 verschiedenen Messzeitpunkten erhoben (vgl. Abb. 7-7). Es lassen sich zwei synchrone Korrelationen (A), zwei Autokorrelationen (B) und zwei zeitverzögerte Kreuzkorrelationen (C) berechnen.
Die Hypothese, nach der X einen kausalen Einfluss auf Y ausübt, nicht aber umgekehrt, ist plausibler, wenn C1 höher ausfällt als C2. In manchen Fällen kann auch eine höhere synchrone Korrelation zum zweiten Messzeitpunkt (A2) eine der beiden konkurrierenden Kausalhypothesen stützen.
So wird in einem Beispiel bei Bortz und Döring (2006, S. 519f) die Hypothese „Die Bildung beeinflusst das Einkommen“ gegenüber der alternativen These „Das Einkommen beeinflusst die Bildung“ dadurch gestützt, dass die Korrelation A2 höher ausfällt als A1. Die Erklärung dafür lautet, dass sich die Bildung zum Messzeitpunkt t1 bei Personen mit 25 Jahren noch nicht so stark auf das Einkommen auswirken konnte (A1) wie zum Zeitpunkt t2, zu dem die Probanden 50 Jahre alt waren.

52
Q

Was ist eine Pfadanalyse?

A

Die Pfadanalyse erweitert die multiple Korrelationsund Regressionsrechnung, indem Zusammenhänge zwischen mehreren unabhängigen und abhängigen Variablen gleichzeitig berücksichtigt werden. In Theorien bzw. theoretischen Modellen werden in der Regel Zusammenhänge zwischen mehr als zwei oder drei Variablen postuliert und es liegen auch Annahmen über Kausalbeziehungen zwischen den Variablen vor. Solche Zusammenhänge können in einem Pfadmodell grafisch dargestellt und einer empirisch-statistischen Prüfung unterzogen werden.

Sie haben im Abschnitt 7.4.3.2 bereits das Mediatorkonzept kennengelernt und in einem statistischen Exkurs gelesen, dass drei Regressionsgleichungen erforderlich sind, um zu prüfen, ob eine Variable den Zusammenhang zwischen zwei anderen Variablen mediiert. In der Pfadanalyse und auch in Strukturgleichungsmodellen können die mediierenden Variablen ebenfalls als abhängige Variable aufgefasst werden, wenn theoretisch angenommen wird, dass die im Modell als unabhängig betrachtete Variable „kausal“ die mediierende Variable beeinflusst.

53
Q

In einem Pfadmodell werden direkte und indirekte Effekte unterschieden - beschreibe diese!

A

Direkte Effekte sind unvermittelte (d.h. unmittelbare) Zusammenhänge zwischen einer unabhängigen und einer abhängigen Variable. In Abbildung 7-8 symbolisieren z.B. die Pfeile von x1 zu y1 sowie x1 zu y2 direkte Effekte.
Dagegen werden die Pfade von x1 bzw. x2 über y1 zu y2 als indirekte Effekte bezeichnet. Indirekte Effekte sind also Zusammenhänge zwischen zwei Variablen, die von einer (oder mehreren) anderen Variablen mediiert werden.
Der Doppelpfeil zwischen x1 und x2 symbolisiert einen nur korrelativen Zusammenhang zwischen diesen beiden Variablen – sei es, weil (a) aus theoretischer oder methodischer Sicht (z.B. bei zeitgleicher Erhebung der Variablen x1 und x2) keine kausale Beziehung zwischen diesen Variablen spezifiziert werden kann, sei es, weil (b) in Pfadmodellen mehrere unabhängige Variablen verwendet werden können, zwischen denen keine kausalen Beziehung spezifiziert werden muss .
Wenn wir den oben von Hertel et al. (2005, in press) zitierten Mediationseffekt in dieses Pfadmodell übertragen, so wäre die emotionale Labilität x1, die soziale Angst/Reduktion von Unsicherheit y1 und die Präferenz für asynchrone Medien y2. x2 könnte eine weitere unabhängige Variable sein, z.B. Extraversion. Ein anderes inhaltliches Beispiel für ein Pfadmodell finden Sie bei Bortz und Döring (2006, S. 520).

54
Q

Was sind Strukturgleichungsmodelle?

A

Im Abschnitt 2.4 wurde ausgeführt, dass eine Theorie gemäß der Aussagenkonzeption theoretische Begriffe oder Konstrukte und Beobachtungsbegriffe enthält. Ängstlichkeit z.B. ist ein hypothetisches Konstrukt, das nicht direkt beobachtbar ist; es ist latent, d.h. es „verbirgt“ sich sozusagen hinter den beobachtbaren Phänomenen. Beobachtbare, manifeste Phänomene bzw. Indikatoren lassen sich aber über Korrespondenzregeln (vgl. Kap. 5.1.) mit den theoretischen Begriffen verknüpfen.
Im Abschnitt 7.4.3.3 haben wir mit der Faktorenanalyse ein statistisches Verfahren in Grundzügen kennen gelernt, das die Ableitung von latenten Variablen, eben den sogenannten Faktoren, aus den korrelativen Beziehungen zwischen beobachteten, manifesten Variablen (z.B. Selbst- oder Fremdeinschätzungen in einem Fragebogen, beobachtete Häufigkeiten bestimmter Verhaltensweisen) gestattet.
Wenn wir nun dieses faktorenanalytische Prinzip der Unterscheidung zwischen manifesten und latenten Variablen mit den regressions- und pfadanalytischen Modellen verbinden, dann entsteht eine neue Klasse von Verfahren, die sogenannten (linearen) Strukturgleichungsmodelle. Der Begriff „Strukturgleichungsmodelle“ ist die generische Bezeichnung für eine Gruppe von Verfahren (vgl. z.B. Raykov & Marcoulides, 2006) zu der z.B. auch die konfirmatorische Faktorenanalyse gezählt wird.
Eine Pfadanalyse basiert lediglich auf manifesten, d.h. beobachteten Variablen, weil in dieses statistische Verfahren als mehrfacher Regressionsanalyse kein Modell zur Messung von latenten Variablen integriert bzw. integrierbar ist.
Der Begriff Pfadmodell wird dagegen weiter gefasst und schliesst grafische Darstellungen von Strukturgleichungsmodellen (oder gar Faktoranalysen) mit ein.

55
Q

Was sind Meß- und Strukturmodelle?

A

Ein Strukturgleichungsmodell umfasst ein Messmodell und ein Strukturmodell. Das Messmodell spezifiziert die Beziehungen zwischen den beobachteten Variablen und den hypothetischen Konstrukten. Das Strukturmodell beschreibt die Zusammenhänge zwischen den theoretischen Konstrukten.
Ein Strukturgleichungsmodell ist also ein Pfadmodell, das ein Messmodell enthält. Das Messmodell hat den Vorteil, dass Fehler bei der Messung beobachteter Variablen explizit berücksichtigt werden und die Zusammenhänge zwischen den latenten Variablen deshalb genauer geschätzt werden können.
Die folgende Abbildung 7-9 veranschaulicht die Unterscheidung zwischen dem Strukturmodell und drei Messmodellen in einem Strukturgleichungsmodell mit drei latenten Variablen. Die Abbildung wurde in Anlehnung an den Beitrag von Nachtigall, Kroehne, Funke & Steyer (2003, S. 5) erstellt. Dieser gut lesbare englische Artikel zu den Vorund Nachteilen von Strukturgleichungsmodellen ist online verfügbar unter folgender URL: www.dgps.de/fachgruppen/methoden/mpr-online/issue20/art1/mpr127_11.pdf