M1 F8 Flashcards
Im Folgenden werden zwei Typen von Untersuchungsdesigns vorgestellt, die in der Regel als quasi-experimentelle klassifiziert werden und besonders für die Evaluationsforschung wichtig sind. Welche sind das?
1 Anordnung mit nicht gleichartiger Kontrollgruppe
2 Einfache und mehrfache Zeitreihenanordnung
Ist bei einer Evaluationsstudie eine Zufallszuordnung der Probanden zu den verschiedenen Untersuchungsbedingungen bzw. Treatments möglich?
Aufgrund der bisherigen Erläuterungen zu quasi-experimentellen Designs ist schon per definitionem ausgeschlossen, dass bei einer Evaluationsstudie eine Zufallszuordnung der Probanden zu den verschiedenen Untersuchungsbedingungen bzw. Treatments möglich ist (z.B. Abteilungen in Betrieben oder Organisationen; Schulklassen; Gruppen in Kindergärten; Stationen in Pflegeheimen).
Beschreibe Sinn und Zweck der Randomisierung bestehender Gruppen!
Da bei Evaluationsstudien häufig mit bestehenden Gruppen als Einheiten gearbeitet werden muss, bleibt wenigstens zu prüfen, ob den verschiedenen Untersuchungsbedingungen per Zufall bestimmte Gruppen bzw. Abteilungen zugeordnet werden können. Dadurch kann eine systematische Bevorzugungen oder Benachteiligungen von Gruppen bzw. Abteilungen bei der „Zuteilung“ von Schulungen, Innovationen oder Interventionen vermieden werden. Diese Randomisierung bestehender Gruppen führt jedoch – im Gegensatz zur Randomisierung einzelner Personen nicht zu einer Vergleichbarkeit der Untersuchungsgruppen.
Wie kann man in Evaluationsstudien die fehlende Vergleichbarkeit der Untersuchungsgruppen ausgleichen?
Um die Unterschiede zu erfassen, die bereits vor Beginn des Treatments zwischen den Gruppen (und auch zwischen den einzelnen Probanden) in den zu beeinflussenden abhängigen Variablen – sowie bei wichtigen Kontrollvariablen – bestehen, ist deshalb ein Vortest obligatorisch. So entsteht eine Kontrollgruppenanordnung mit Vor- und Nachtest, die ähnlich bereits im Kap. 7.2.3 als „echte experimentelle Anordnung“ vorgestellt worden ist, weil zusätzlich eine Randomisierung der Probanden Bestandteil des Designs war.
Die Randomisierung bestehender Gruppen wird hier durch (R) dargestellt.
(R)O1X O2(Versuchgruppe mit Vor- und Nachtest) (R)O1O2(Kontrollgruppe mit Vorund Nachtest)
Welche Störfaktoren gibt es in Evaluationsstudien bei der Randomisierung bestehender Gruppen?
Störfaktoren der kausalen Interpretation von Haupteffekten des Treatments auf die abhängige(n) Variable(n) liegen bei diesen Designs insbesondere im Bereich der Anfangsunterschiede zwischen den Gruppen – und sollten durch Erhebung wichtiger Einflussfaktoren beim Vortest kontrolliert werden. Ansonsten gilt für
dieses Design, dass die möglichen Haupteffekte der folgenden Typen von Störfaktoren kontrolliert werden:
Testeffekte sowie Veränderung der verwendeten Hilfsmittel, natürliche Änderungsprozesse und zwischenzeitliches Geschehen (vgl. Abschnitt 7.2.4). Auch Wechselwirkungen zwischen diesen Typen von Störfaktoren und der Zuordnung zu den Untersuchungsbedingungen können bei dieser Anordnung durch die Randomisierung der Gruppen weitgehend ausgeschlossen werden.
Hinweis: Falls keine Zufallszuordnung der Gruppen realisiert werden kann, müssen die möglichen Wechselwirkungen zwischen den genannten Typen von Störfaktoren und dem jeweiligen Treatment geprüft werden (vgl. dazu die detaillierte Diskussion der Anordnung 10 bei Campbell & Stanley, 1970, S. 564).
Was ist - bei Evaluationsstudien mit nichtgleichartiger Kontrollgruppe - das Problem bei folgendem Fall: Wenn kein Vortest durchgeführt werden konnte – und beim Nachtest nur die abhängige Variable und keine weiteren Kontrollvariablen erhoben wurden?
Bei einer solchen Untersuchung kann der Haupteffekt des Treatments mit Haupteffekten der wichtigsten Störfaktoren konfundiert sein. Dazu sei ein Beispiel genannt, dem ein Evaluationsdesign zugrunde lag, bei dem bestimmte verfügbare Daten nachträglich für eine bestimmte Fragestellung ausgewertet wurden (ein sogenanntes „ex-postfacto-Design): Im „Prolog“ ihres Handbuchbeitrages „Experimentation in Social Psychology“ berichten Aronson, Wilson und Brewer (1998, S. 99 f.) über eine Evaluation von „college-level educational programs in our prisons“, über die ein enthusiastischer Pressebericht erschienen war, und stellen zu dem Bericht eine zentrale methodische Frage:
Are the prisoners who were „assigned“ to the control condition the same kind of people as those „assigned“ to the experimental condition? That is, might it not be the case that the prisoners who signed up for the course of study and completed a year of it were different to begin with (say in motivation, ability, intelligence, prior education, mental health, or what you have) from those who did not sign up for the course – or those who signed up but dropped out early? (S. 99)
Dieses sozialpolitische Beispiel soll die Interpretationsprobleme allzu einfacher Untersuchungsdesigns und die praktische Relevanz interner Validität zeigen. Dieses Beispiel zeigt auch die Grenzen der o.g. Strategie der Randomisierung von Gruppen: dieses Verfahren ist im Fall der freiwilligen Teilnahme einzelner Personen nicht anwendbar. Als Alternative bleibt – wie beim Experiment, die Möglichkeit der Randomisierung der Personen, wenn einer großen Zahl von Interessierten eine viel kleinere Zahl an „Versuchsplätzen im Feld“ gegenübersteht, sodass die Gesamtliste der Interessierten per Zufall aufgeteilt werden kann in eine Versuchs- und eine Kontrollgruppe.
Nenne ein Beispiel für eine Randomisierung von Gruppen in einer quasi-experimentellen Studie - und erkläre, warum es kein Experiment ist!
Im Themenbeispiel „Statistik-Lernen in virtueller Lernumgebung“ (vgl. Abschnitt 7.2.2) würde ein solches Vorgehen bedeuten, bei 200 interessierten Studierenden nur 100 diese neue Lernmöglichkeit zu offerieren und sie per Zufall auszuwählen, die anderen 100 aber zu einer Art Kontrollgruppe zusammenzufassen und ihnen z.B. eine etwas verbesserte Variante der klassischen Lernmaterialien oder Präsenzveranstaltungen anzubieten (also ein alternatives Treatment).
Eine solche Untersuchung, die – mit oder ohne Vortest – über ein Semester laufen würde und die abschließende Klausur als Nachtest verwendet, würde trotz der angewendeten Randomisierung nicht unbedingt als Experiment klassifiziert, weil keinerlei Kontrolle über das Treatment als einem zentralem Element eines Experimentes besteht, von einer Standardisierung des Treatments (z.B. durch streng gesteuerte Abfolge von interaktiven Übungen in der Kabine eines Labors) ganz abgesehen. Es wäre sehr aufwendig zu erfassen, wann und wie lange die einzelnen Versuchspersonen welche interaktiven Übungen zur Statistik wie genutzt haben. Durch eigene Auswahl der Übungen würde jede Versuchsperson ihr Treatment quasi selbst zusammenstellen. Diese Skizzierung soll zweierlei zeigen:
- Eine fehlende Standardisierung des Treatments kann zwar inhaltlich sinnvoll sein (insbesondere bei der Untersuchung individueller Arbeitsund Lernprozesse), führt aber zu Problemen bei (a) der Beschreibung und Vergleichbarkeit individueller Aktivitäten bzw. Treatments und (b) bei der Interpretation der Treatmenteffekte: worauf sind eventuell aufgetretene Unterschiede zurückzuführen?
- Je komplexer ein Treatment ist (d.h. je mehr einzelne Komponenten es umfasst), desto weniger kann festgestellt werden, auf welche der einzelnen Komponenten aufgetretene Effekte zurückzuführen sind.
Sollte z.B. untersucht werden, welche 3 aus 10 verfügbaren interaktiven Übungen am effektivsten für das Erlernen der Grundbegriffe schließender Statistik sind, so müssten alle möglichen Kombinationen von 3 aus 10 Übungen mit Berücksichtigung der Reihenfolge in jeweils einer Untersuchungsgruppe erprobt werden (also insgesamt 720 Treatments). Dieses Vorgehen ist auch indiziert bei Untersuchungen zur Frage einer optimalen Kombination von Medikamenten, therapeutischen oder sozialpädagogischen Einzelmaßnahmen (z.B. zur Therapie bestimmter Erkrankungen oder abnormer Verhaltensweisen). Wenn nur insgesamt 2 Komponenten untersucht werden sollen, so genügt aber ein einfaches zweifaktorielles Design mit 4 Untersuchungsgruppen.
Was ist der Unterschied zwischen echten experimentellen Anordnungen und Zeitreihenanordnungen?
Ein konzeptuell anderer Ansatz für die Diagnose von Treatmenteffekten liegt einer Zeitreihenanordnung bzw. einem Zeitreihendesign zugrunde. Während in echten experimentellen Anordnungen die Untersuchung des Effekts des Treatments durch Vergleich der Versuchsgruppe mit einer Kontrollgruppe erfolgt, und ein Vortest eher zur Kontrolle von Gruppenunterschieden dient, wird bei Zeitreihenuntersuchungen der Effekt des Treatments nicht primär über den Gruppenvergleich bestimmt, sondern durch Vergleich des – über mehrere Messzeitpunkte bestimmten durchschnittlichen Wertes der abhängigen Variable bei der Person i vor dem Treatment mit dem durchschnittlichen Wert derselben Person nach dem Treatment.
Dieses Design kann als Längsschnittdesign bzw. als Panelstudie klassifiziert werden, da über einen längeren Zeitraum Erhebungen an denselben Personen durchgeführt werden (die Intervention ist dabei nicht berücksichtigt).
Ist jede mehrfache Messung derselben Person mit einem Längsschnittdesign verbunden?
Werden allerdings in einer Laboruntersuchung z.B. physiologische Reaktionen auf einen bestimmten Stimulus wiederholt vor und nach dessen Präsentation gemessen, um den zeitlichen Verlauf der abhängigen Variable zu analysieren, so wird diese Untersuchung zwar das gleiche Design haben, aber in einer „Sitzung“ durchgeführt und nicht als Längsschnitt bezeichnet. Jedes EKG, das in einer ärztlichen Praxis z.B. unter körperlicher Belastung des Patienten erstellt wird, ist nur eine Diagnose und keine Längsschnittuntersuchung, auch wenn zu mehreren, aufeinanderfolgenden Zeitpunkten gemessen wird.
Was ist der Unterschied zwischen Zeitreihenanordnung und Zeitreihenanalyse?
Der Begriff Zeitreihenanordnung ist vom Begriff Zeitreihenanalyse zu unterscheiden: Letzterer bezeichnet eine Gruppe statistischer Verfahren, die zur Auswertung von vielfach wiederholten Messungen (n > 9) angewendet werden. Diese statistischen Verfahren unterscheiden sich wie die Zeitreihenanordnung in der Perspektive, aus der Zeitreihendaten (im Gegensatz zur einmal wiederholten Messung bei Designs mit Vor- und Nachtest) betrachtet werden können: im Focus stehen nicht interindividuelle Unterschiede (zwischen den Probanden) wie bei der Berechnung von Varianzen im klassischen Experiment, sondern die intraindividuellen Schwankungen der Messwerte, die bei wiederholten Messungen von Variablen bei den einzelnen Probanden bestimmt werden können.
Mit Hilfe solcher Verfahren kann untersucht werden, ob zwei Variablen y 1 und y 2 zeitversetzt miteinander korrelieren, d.h. ob Daten einer Zeitreihe y 1i(t) mit Daten einer Zeitreihe y 2i(t-x) einen signifikanten Zusammenhang zeigen. Einführungen in diese Auswertungsverfahren geben neuere Lehrbücher (z.B. Bortz & Döring, 2006, S. 568 ff. sowie Rohwer & Pötter, 2001, S. 181); Vertiefung bietet die Monographie von Schmitz (1987). Eine Anwendung dieser Methodik auf „studentisches Arbeiten“ hat Meier (1981) durchgeführt.
O1O2O3XO4O5O6O7(Versuchgruppe)
O1O2O3O4O5O6O7(Kontrollgruppe)
Was ist der Unterschied zwischen einfacher und mehrfacher Zeitreihenanordnung?
Besteht eine Zeitreihenanordnung nur aus der Versuchsgruppe, wird das Design als einfache Zeitreihenanordnung bezeichnet, sonst als mehrfache. Das Fehlen einer Vergleichsgruppe hat erhebliche Auswirkungen auf die interne Validität. Campbell und Stanley (1970) betonen, dass beim mehrfachen Zeitreihendesign alle Störfaktoren der internen Validität kontrolliert werden und kommen deshalb zu der Bewertung, das dies „eine ausgezeichnete quasi-experimentelle Anordnung, vielleicht die beste der brauchbaren Anordnungen“ ist, die besonders für die Unterrichtsforschung geeignet sei, da hier ohnehin „wiederholte Messungen leicht vorgenommen werden können“ (S. 585).
Nenne ein Beispiel für eine Zeitreihenanordnung!
Dafür sei eine Studie im Schulbereich skizziert, bei der die Effekte von einwöchigen Klassenfahrten auf die Soziale Integration in Schulklassen der Jahrgangsstufe 5 untersucht werden soll. Die Operationalisierung der abhängigen Variable könnte z.B. durch ein Soziogramm erfolgen, das monatlich erhoben wird (zur Soziometrie s. Witte, 1989, Kap. C.2.1.4).
Wird eine solche Studie z.B. an einer großen weiterführenden Schule durchgeführt, in der die Orientierungsstufe (im Land NRW) sechs Parallelklassen hat, so könnten die Klassenfahrten aus organisatorischen Gründen nicht zeitgleich stattfinden, sondern zeitversetzt (z.B. mit jeweils zwei Klassen gleichzeitig). Damit ergibt sich ein Untersuchungsdesign, das als „Zeitreihenanordnung mit wechselnden Treatments“ bezeichnet wird und eine sehr gute Kontrolle verschiedener Störfaktoren (insbesondere des zwischenzeitlichen Geschehens) erlaubt, weil zu jedem Treatment mehrere Klassen als Kontrollgruppen zur Verfügung stehen – und hier außerdem in jeweils zwei Gruppen bzw. Klassen das Treatment zeitgleich erfolgt.
(Klasse5A) O1 O2 XA O3 O4O5O6O7
(Klasse5B) O1 O2 XB O3 O4O5O6O7
(Klasse5C) O1 O2 O3 O4XCO5O6O7
(Klasse5D) O1 O2 O3 O4XDO5O6O7
(Klasse5E) O1 O2 O3 O4O5O6XEO7
(Klasse5F) O1 O2 O3 O4O5O6XFO7
In dem skizzierten Beispiel wäre es sicher möglich, die Entscheidung über den Zeitpunkt der Klassenfahrt zu randomisieren, d.h. per Zufall die Klassen zu einem der drei fixierten Zeitpunkte der Zeitreihenanordnung auf Klassenfahrt zu schicken. Eine solche Randomisierung der Gruppen wäre eine methodisch begründete Alternative zu einer bedarfsorientierten Zuordnung der Klassen zu Terminen (z.B. diejenigen Klassen zuerst, in denen die meisten Außenseiter und Konflikte existieren).
Unabhängig von solchen systematischen Unterschieden zwischen einzelnen Klassen würden Daten des dargestellten Designs es erlauben, Antworten auf folgende Fragen zu geben, für deren Beantwortung ein Zeitreihendesign notwendig ist:
Gibt es signifikante Unterschiede des Treatments zwischen den Klassen, die zum gleichen Zeitpunkt die Klassenfahrt unternommen haben? Gibt es z.B. Wechselwirkungen zwischen dem Treatment Klassenfahrt einerseits und Merkmalen der Klassen bei vorherigen Messungen? Sind die Effekte bei Klassen mit vielen Außenseitern und Konflikten größer als bei „mittleren“ Klassen? Welchen Anteil hat dabei der sogenannte Regressionseffekt? Zu welchem der gewählten Zeitpunkte hat das Treatment „Klassenfahrt“ den größten Effekt auf die abhängige Variable Soziale Integration? Inwieweit können Indikatoren der Sozialen Integration in einer Klasse durch die Messwerte vom vorherigen Erhebungszeitpunkt erklärt werden (d.h.: wie hoch ist die sogenannte Autokorrelation dieser Messwerte)?
Bevor ein aktuelles Beispiel einer Zeitreihenanordnung skizziert wird, sei auf den in Abschnitt 7.6 erläuterten Aspekt kausaler Analysen hingewiesen, da er bei der Planung von Zeitreihenuntersuchungen von zentraler Bedeutung ist:
Es müssen Annahmen über den kausalen Prozess, der von der Interventionsmaßnahme zum Eintreten von (erwünschten wie unerwünschten) Effekten führt, getroffen werden, die zur Festlegung des konstanten Zeitintervalls geeignet sind, das jeweils zwischen den wiederholten Messungen der abhängigen Variable(n) liegen soll. (Schmitz, 1987, S. 137)
Dabei müssen interindividuelle Unterschiede der kausalen Verzögerung zwischen dem Beginn der Maßnahme und dem Eintreten des Effekts einkalkuliert werden bei Evaluationen mehrerer Organisationen auch interinstitutionelle Unterschiede.
Im Beispiel von Klassenfahrten als Interventionsmaßnahme zur sozialen Integration müssen die Erhebungen der Soziogramme mindestens monatlich erfolgen, bevor die Effekte von Klassenfahrten womöglich nicht mehr feststellbar oder durch „zwischenzeitliches Geschehen“ überlagert sind. Auch der Prozess des „Abklingens“ von Effekten der bei sozialen Interventionen, wie auch Lernprozessen zu beobachten ist (s.o. Vergessenskurve), kann nur durch entsprechend kurze Zeitintervalle zwischen den Messungen erfasst werden. Die praktische Grenze einer täglichen Erfassung wird vom Gegenstand abhängen. Bei Soziogrammen sind keine wesentlichen systematischen Schwankungen zu erwarten, bei anderen Themenbereichen dagegen schon (vgl. Lambertz, 1999).
Was sind korrelative Designs?
Korrelative Designs dienen der Untersuchung von Fragen bzw. Hypothesen zu Zusammenhängen zwischen psychologischen Variablen bzw. Konstrukten. Dabei können sowohl lineare als auch nicht-lineare Zusammenhänge analysiert werden. Als Design kommen sowohl Querschnitts- oder Längsschnittuntersuchungen in Frage, wobei letztere wiederholte Erhebungen an denselben Personen erfordern; dadurch ermöglichen sie auch deskriptive Aussagen über mögliche Veränderungsprozesse.
Was wird in der Korrelationsforschung untersucht?
In der Korrelationsforschung werden Zusammenhänge zwischen zwei oder mehreren Merkmalen untersucht. Während die experimentelle Forschung darauf abzielt, Variationen der abhängigen Variable(n) durch die Manipulation von unabhängigen Variablen selbst herzustellen, geht es in der Korrelationsforschung um Zusammenhänge zwischen bereits existierenden Variationen zwischen Merkmalen von Individuen, sozialen Gruppen oder anderen interessierenden Merkmalsträgern (vgl. Cronbach, 1957): Gibt es z.B. einen Zusammenhang zwischen Intelligenz und Berufserfolg? Wie hängen Persönlichkeitsmerkmale mit der Bewältigung von Stress zusammen? Welche soziodemographischen (z.B. Alter, Geschlecht, Bildungsstand) und welche Persönlichkeitsmerkmale (z.B. Extraversion, Gewissenhaftigkeit, Impulsivität) hängen mit welchen Arten der Internetnutzung zusammen?
Benenne die Unterschiede zwischen Korrelationsstudien und Experimenten!
Das Experiment gilt für die psychologische Forschung zwar als der „Königsweg“, weil mit dieser Methode kausale Beziehungen zwischen unabhängigen und abhängigen Variablen untersucht und aufgedeckt werden können. Die experimentelle Methode setzt allerdings voraus, dass sich unabhängige Variablen willkürlich variieren und Störvariablen möglichst vollständig kontrollieren lassen. Diese Bedingungen können bei vielen psychologischen und insbesondere sozialwissenschaftlichen Fragestellungen aus prinzipiellen, ökonomischen und ethischen Gründen nicht realisiert werden. Wenn z.B. die Bedeutung von Persönlichkeitsmerkmalen für Gesundheit und psychisches Wohlbefinden untersucht werden soll, dann können Persönlichkeitsmerkmale wie z.B. Extraversion, Gewissenhaftigkeit und emotionale Labilität nicht willkürlich variiert, d.h. hergestellt werden, da diese Eigenschaften als sogenannte Organismusvariablen bereits in einer bestimmten Ausprägung vorliegen. Ein Experimentator kann eine Person nicht gewissenhafter oder extravertierter machen als sie ist. Ein anderes Beispiel ist das Geschlecht eines Untersuchungsteilnehmers, das vom Experimentator natürlich auch nicht willkürlich verändert werden kann. Organismusvariablen können in einem Experiment zwar nicht systematisch variiert, aber selegiert werden, d.h. das Geschlecht einer Versuchsperson kann als zusätzlicher Faktor in einem mehrfaktoriellen Design berücksichtigt werden. Bei anderen Fragestellungen ist ein experimenteller Zugang aus ökonomischen oder ethischen Gründen nicht möglich. Ein weiterer Vorteil der Korrelationsforschung gegenüber experimentellen Designs ist, dass Zusammenhänge zwischen vielen Variablen untersucht werden können. In einem Experiment werden dagegen in der Regel nur wenige unabhängige und abhängige Variable berücksichtigt.
Was ist der Nachteil von Korrelationsstudien?
Verfahren zur Analyse von Zusammenhängen kommen in der sozialwissenschaftlichen Forschung (z.B. Soziologie, Politologie, Psychologie) aus den genannten Gründen häufiger zum Einsatz als die experimentelle Methode, sie haben allerdings einen entscheidenden Nachteil: Korrelative Zusammenhänge dürfen nicht kausal interpretiert werden; es ist lediglich möglich, durch bestimmte korrelative Designs (Längsschnittstudien und insbesondere cross-lagged panel designs, s.u.) und/oder inhaltliche Überlegungen die Anzahl kausaler Erklärungsalternativen einzuschränken bzw. zu falsifizieren. Jedoch hängt die Frage nach der kausalen Interpretierbarkeit korrelativer Zusammenhänge auch vom zugrundeliegenden Kausalitätskonzept ab (vgl. Abschnitt 7.6). Korrelative Zusammenhänge sind zudem nicht deterministisch, wie viele funktionale Zusammenhänge, die z.B. in der Physik ermittelt wurden, sondern lediglich stochastisch (zufallsabhängig) und damit nur mit einer gewissen Wahrscheinlichkeit zutreffend.
Um Missverständnisse zu vermeiden, sei gleich an dieser Stelle darauf hingewiesen, dass Korrelationsforschung nicht auf eine einzige statistische Prozedur beschränkt ist, etwa den Bravais-Pearson Korrelationskoeffizienten. Auch regressions-und- faktorenanalytische Analyseverfahren (s.u.) zählen zur Korrelationsforschung, denn auch damit werden bestimmte Arten von Zusammenhängen ermittelt. Die statistischen Verfahren zur Untersuchung und Überprüfung von Zusammenhängen werden insbesondere im Modul 2, aber auch im Modul 6 und 7 vermittelt. In diesem Abschnitt wird lediglich ein inhaltlicher, weitgehend nicht-technischer Überblick zu verschiedenen korrelativen Designs bzw. Zusammenhangshypothesen gegeben.
Was sind Bivariate Zusammenhangshypothesen?
Bivariate Zusammenhangshypothesen betreffen vermutete Assoziationen zwischen zwei Merkmalen. Gibt es z.B. einen Zusammenhang zwischen dem Alter und der durchschnittlichen Internetnutzungszeit pro Woche? Diese Fragestellung lässt sich je nach Vorwissen (bzw. in anderen Fällen theoretisch begründet) als ungerichtete oder gerichtete Zusammenhangshypothese formulieren.
Was ist der Unterschied zwischen gerichteten und ungerichteten Zusammenhangshypothesen?
Ungerichtete Zusammenhangshypothesen nehmen lediglich eine Assoziation zwischen zwei Merkmalen an und spezifizieren nicht, ob es sich dabei um einen negativen oder positiven Zusammenhang handelt, in unserem Beispiel: das Alter und die Internetnutzung hängen zusammen. Gerichtete Zusammenhangshypothesen spezifizieren dagegen die Richtung der Assoziation, z.B. Das Alter hängt negativ mit der durchschnittlichen Internetnutungszeit zusammen oder anders formuliert: Höheres Alter geht mit niedrigerer Internetnutzung einher. Die Richtung des Zusammenhangs kann auch positiv formuliert werden, in unserem Fall würde die Hypothese dann lauten: Höheres Alter geht mit höherer Internetnutzung einher.
Wie kann man bivariate Zusammenhangshypothesen untersuchen?
Um bivariate (ungerichtete oder gerichtete) Zusammenhangshypothese untersuchen zu können, müssen die beiden Merkmale an einer größeren, möglichst repräsentativen Stichprobe erhoben werden (die durchschnittliche Internetnutzungszeit lässt sich einfach, aber relativ ungenau per Selbsturteil einschätzen). Pro Person oder Merkmalsträger würden dann zwei Messwerte resultieren und für die gesamte Stichprobe zwei Messwerte-Reihen mit eindeutig einander zuordenbaren Messwerten. Mit Hilfe eines Korrelationskoeffizienten lässt sich nun ermitteln, in welchem Ausmaß die beiden Merkmale Alter und durchschnittliche Internetnutzungszeit pro Woche gemeinsam variieren bzw. kovariieren. Die Kovariation lässt sich als Art des Zusammenhangs beschreiben: Ein positiver oder negativer linearer Zusammenhang ist der Fall, wenn hohe Ausprägungen des einen Merkmals mit hohen bzw. niedrigeren Ausprägungen des anderen Merkmals assoziiert sind, z.B. je höher das Alter desto niedriger die durchschnittliche Internetnutzungszeit (negativer linearer Zusammenhang).
Wann liegt ein nicht-linearer Zusammenhang vor?
Ein nicht-linearer Zusammenhang würde z.B. vorliegen, wenn die durchschnittliche Internetnutzungszeit bis zu einem bestimmten Alter abnimmt, im höheren Erwachsenenalter dann aber wieder zunimmt. Eine mögliche Erklärung für diesen fiktiven und konstruierten nicht-linearen Zusammenhang könnte sein, dass Personen im höheren Lebensalter zunehmend mehr das Internet als Kommunikationsmedium für sich entdecken und es besonders intensiv nutzen können, da ihnen viel freie Zeit zur Verfügung steht (sogenannte silver surfer). Ein empirisch gesicherter nicht-linearer Zusammenhang ist das Yerkes-Dodson-Gesetz (Yerkes & Dodson, 1908), nach dem die Produktivität bis zu einem mittleren Erregungsniveau kontinuierlich ansteigt, mit höheren Erregungsniveaus dann aber abnimmt (umgekehrt U-förmiger Zusammenhang, vgl. Abbildung 7-3).
Was läßt sich alles in Zusammenhangshypothesen bestimmen?
Neben der Art des Zusammenhangs (linear vs. nicht-linear) lässt sich noch die Richtung (positiv oder negativ) und die Intensität bzw. Enge bestimmen. Korrelationskoeffizienten können Werte zwischen + 1 und – 1 annehmen. Je höher der Betrag des Koeffizienten desto enger der (positive oder negative) Zusammenhang zwischen 2 Merkmalen. Wird ein Korrelationskoeffizient von + 1 oder – 1 ermittelt, dann liegt ein perfekter linearer und damit nicht mehr stochastischer, sondern deterministischer Zusammenhang vor. Die Ausprägungen des einen Merkmals lassen sich dann bei Kenntnis der Ausprägungen des anderen Merkmals perfekt vorhersagen (über eine lineare Regressionsgleichung, vgl. Modul 2 bzw. nächster Abschnitt). Derart hohe Korrelationen kommen empirisch in der Psychologie aus verschiedenen Gründen so gut wie nie vor, da Erleben und Verhalten immer mit multiplen Bedingungen assoziiert ist, die zudem in Wechselwirkung treten können (vgl. nächster Abschnitt). Abgesehen davon mindern Fehler bei der Messung der interessierenden Merkmale die Enge des Zusammenhangs (vgl. hierzu noch ausführlicher Modul 6, Kurs Testkonstruktion). Nach Konventionen von Cohen (1988) können Korrelationen um +/.10 als schwache Zusammenhänge, um +/. 30 als mittlere Zusammenhänge und um +/.50 als starke Zusammenhänge interpretiert werden. Eine Korrelation von +/.50 zwischen zwei Merkmalen ist noch weit von einem perfekten Zusammenhang entfernt, gilt in der Psychologie aber wegen der multiplen Bedingtheit des Erlebens und Verhaltens schon als starker Zusammenhang.
Wovon hängt es ab, welcher Korrelationskoeffizient herangezogen werden kann?
Welcher Korrelationskoeffizient herangezogen werden kann, hängt vom Skalenniveau der erfassten Merkmale ab. In Tabelle 7-4 werden die Korrelationskoeffizienten in Abhängigkeit vom Skalenniveau lediglich aufgelistet; genauere Informationen erhalten Sie im Modul 2. Unterstellt man in unserem Beispiel den Selbsteinschätzungen der Internetnutzungszeit Intervallskalen-Niveau (was sicher nicht unproblematisch ist), dann kann die Bravais-Pearson-Produkt-MomentKorrelation berechnet werden.
Tab. 7-4: Bivariaten Korrelationsarten:
|| Merkmal y Merkmal x
|| | Intervallskala | Dichotomes Merkmal | Ordinalskala
|| Intervallskala | Produkt-MomentKorrelation | Punktbiseriale Korrelation | Rangkorrelation
|| Dichotomes Merkmal | | Φ -Koeffizient | Biseriale Rangkorrelation
|| Ordinalskala | | | Rangkorrelation
Bei dem angeführten Beispiel zum Lebensalter und dem Ausmaß der Internetnutzung handelt es sich um ein korrelatives Querschnittdesign, bei dem die Erhebung der Merkmalsausprägungen nur zu einem bestimmten Messzeitpunkt erfolgt (Genaueres zu Querschnittdesigns erfahren sie im Modul 4 zur Entwicklungspsychologie).