6. Experimentelle und nicht-experimentelle Forschungsdesigns Flashcards
6. Experimentelle und nicht-experimentelle Forschungsdesigns
Experiment
- beste Methode, um Ursache-Wirkung-Beziehungen zwischen Variablen zu identifizieren
- in Grundlagenforschung: Testen von aus Theorien abgeleiteten Kausalhypothesen
- in angewandter Forschung: Testen der Wirkung von Interventionsmaßnahmen
Die Logik des Experiments - Man kann schließen, dass A ursächlich für B ist, wenn:
- A und B kovariieren / korrelieren
- A zeitlich vor B auftritt → man manipuliert die unabhängige Variable A und schaut, ob sich die abhängige Variable B verändert. Oft auch einfach eine Situation, in der A anwesend ist (Experimentalbedingung) und eine, in der A abwesend ist (Kontrollbedingung)
- Andere Ursachen als A können ausgeschlossen werden. Gefahr der Kofundierung: tatsächlich ist eine Störvariable, die mit A korreliert, ursächlich für B
Interne Validität vs Externe Validität
Experiment ist intern valide, wenn:
- es fehlerfreie Aussagen über Kausalbeziehungen zwischen Variablen ermöglicht, d.h. Veränderungen in der AV können ausschließlich auf die Variation der UV zurückgeführt werden
Experiment is extern valide, wenn:
- die Ergebnisse des Experiments übertragbar sind: 1. Populationsvalidität, 2. Situationsvalidität, 3. Variablenvalidität
Kritik an der Psychologie:
- Gut kontrollierte Experimente sind oft sehr artifiziell und keine natürliche Situation
- Meist sind die Vpn sehr homogene Gruppen von 20-30 Jährigen Psychologiestudenten und nicht repräsentativ für die Population
–> keine externe Validität! Aber eine hohe externe Validität geht meist nur auf Kosten der internen Validität. Und die ist wichtiger. Und diese kann man meist nur im Labor in künstlichen Situationen gewährleisten.
Wie kann man die externe Validität erhöhen?
- Übertragung der Gültigkeit auf andere Personengruppen oft weniger schwierig
- Übertragung der Gültigkeit auf natürliche Situationen schwieriger, der Geltungsbereich ist eingeschränkt → Lösung: Replikation der Studie in verschiedenen Labors mit unterschiedlichen Teilnehmern. Falls gleiches Ergebnis → externe Validität erhöht
- Partielle Replikation: gezielte Änderung einiger Abläufe des ursprünglichen Experiments, um genau herauszufinden, welche der Randbedingungen wirklich essentiell sind
Störvariablen - Kontrolle
Personengebundene Störvariablen (z.B. größerer Männeranteil in Bedingung A als in Bedingung B):
- Randomisieren: die Vpn werden per Zufall den experimentellen Bedingungen zugeteilt
- Parallelisieren: gezielt gleichmäßige Verteilung der vermuteten Störvariablen auf die Bedingungen. Nachteil: Die Störvariablen müssen bekannt sein
Störvariablen in der Versuchssituation:
- Konstanthalten oder Eliminieren: alle Faktoren der Versuchssituation (Lärm, Helligkeit etc) außer die UV werden möglichst konstant gehalten oder gänzlich eliminiert
- Balancieren: man stellt sicher, dass eine Störvariable in allen Bedingungen den gleichen durchschnittlichen Wert annimmt (z.B. bei mehreren Versuchsleitern: jeder Versuchsleiter betreut die verschiedenen Bedingungen gleich häufig)
- systematische Variation: Eine potenzielle Störvariable wird im Sinne der dadurch kontrolliert, dass sie zu einer weiteren UV gemacht wird
- zufällige Variation
Erwartungseffekte
- Kontrolle von Erwartungseffekten durch Beachtung von demand characteristics und standardisiertes Verhalten des Versuchsleiters oder Doppelblindversuche
Erwartungseffekte
Erwartungseffekte auf Seiten der Vpn:
- demand characteristics: Versteckte HInweise in der Untersuchungssituation. Teilnehmer wollen “gute Versuchsteilnehmer” sein und “helfen” dem Versuchsleiter, indem sie sich verhalten wie vermeintlich gewünscht. (oder wollen gezielt sabotieren) –> Vpn nicht über die Bedingungen und Hypothesen informieren: das nennt man Blindversuch
- Placebo-Effekt: eine Krankheit verbessert sich allein durch die Erwartung des Patienten, dass das Medikament helfen wird → z.B. kann in der pharmakologischen Forschung die WIrksamkeit eines neuen Medikaments nur gezeigt werden, indem es besser abschneidet als Placebo –> Gezielte Herstellung gleicher Erwartungen in allen experimentellen Bedingungen (siehe Placebo Kontrollstudien). Problem: in psychologischen Studien oft schwierig eine Placebo-Kontrollbedingung zu realisieren, schwierig geeignetes Placebo zu finden
Erwartungseffekte auf Seiten des Versuchsleiters:
- Rosenthal-Effekt: dumme vs kluge Ratten. Außerdem schneiden Schüler, die der Lehrer für besonders klug hält, ein ahr später besser bei einem Intelligenztest ab, als die anderen Schüler. → self-fulfilling prophecy
→ Gefahr für die interne Validität des Versuchs! Denn der Versuchsleiter weiß ja, in welcher Bedingung er sich gerade befindet und kommuniziert so subtil und unbewusst seine Erwartungen an die Vpn. Zwei Lösungen:
- dem Versuchsleiter nicht sagen, in welcher Bedingung er sich befindet, das nennt man Doppelblindversuch
- Das Verhalten des Versuchsleiters soweit wie möglich standardisieren. Da heute viele psychologische Experimente am Computer durchgeführt werden, ist der Rosenthal-Effekt hier nicht weiter kritisch
Within-Subjects-Design
Vorteile:
- ökonomischer, da weniger Vpn
- perfekte Kontrolle personengebundener Störvariablen
- kann untersuchen, wie sich das Verhalten einer Person mit der Zeit ändert
- größere Teststärke = Power, d.h. weist leichter einen Populationseffekt nach
Nachteile:
- manchmal kann die UV nicht sinnvoll innerhalb ein und derselben Person variiert werden (z.B. Vergleich von zwei Psychotherapiemethoden)
- kein Blindversuch möglich –> daher immer Erwartungseffekte bei Vpn
- zusätzliche Störeffekte durch Reihenfolge der Bedingungen, sogenannte Sequenzeffekte: 1. Positionseffekte, 2. Carry-Over-Effekte 3. zwischenzeitliches Geschehen
Positionseffekte
Übungseffekt bei within-subjects-design. Verhalten der Vpn ändert sich je nachdem, wie oft sie schon teilgenommen haben.
Kontrolle generell gut möglich durch:
- Block-Randomisierung
- ABBA-Balancierung: “Spiegelbildmethode”. Experiment mit drei Bedingunen: A-B-C-C-B-A. Nur verwendbar, wenn Positionseffekte im Verrlauf des Experiments zu einer gleichmäßigen linearen Steigerung oder Verminderung der Leistung führen
- Vollständiges Ausbalancieren: am genauesten, aber Problem: die Zahl der möglichen Reihenfolgen wächst rapide mit der Zahl der experimentellen Bedingungen
- Lateinisches Quadrat
Carry-Over-Effekte (Übertragungseffekte)
Bei within-subjects-design. Eine frühere Bedingung beeinflusst das Verhalten in nachfolgenden Bedingungen. Es gibt also keinen Übungseffekt oder Ermüdungseffekt wie bei Positionseffekten, wo die Position der Bedingung entscheidend ist, sondern es geht einzig und allein darum, ob die Vpn schon einer bestimmten Bedingung ausgesetzt war. Bsp: in Bedingung A erhalten die Vpn einen Lösungshinweis für eine Aufgabe, d.h. Wenn A zeitlich vor B, dann werden die Vpn B auch besser lösen. Wenn B zeitlich vor A, wird A aber nicht beeinflusst. Man kann das nur beheben, indem alle zuerst in B antreten, aber dann hätte man ja Positionseffekte!
Bsp: bei Studien zur Wirkung von Medikamenten. Die hohe Dosis erhöht möglicherweise die Toleranz
–> keine Kontrolle möglich. Sind in einem Experiment carry-over-Effekte zu erwarten, besser between-subjects-design wählen!
Mehrfaktorielles Design
Vorteil von 2x2 Design gegenüber zwei gesonderten einfaktoriellen Experimenten:
Es kann neben dem “Haupteffekt” auch noch festgestellt werden, ob zwischen den beiden UV eine Interaktion besteht. Z.B.: Studie zum Effekt von Gedächtnistraining auf die Erinnerungsleistung von Probanden. UV 1: Teilnahme am Training oder nicht. UV 2: Alter der Probanden. Ergebnis: Gedächtnistraining hilft (=Haupteffekt). Hilft außerdem viel besser bei jüngeren Leuten (=Interaktion) → Einschränkung der externen Validität des Haupteffekts! Nicht auf die Gesamtpopulation übertragbar. Mehrfaktorielles Design also gut geeignet um externe Validität von Befunden zu untersuchen.
Quasi-Experiment
- Experimente, in denen keine Randomisierung der Vpn vorgenommen werden kann.
- Also keine volle Kontrolle der Störvariablen und daher geringere interne Validität
- Dennoch bei der Evaluation von Interventionsmaßnahmen im Feld häufig die beste Untersuchungsmethode (z.B. Testen einer neuen Unterrichtsmethode) und eine eingeschränkte Kontrolle der Störvariable kann durch geeignete Designs erreicht werden
Anker-Effekt (random)
Menschen benutzen für Schätzungen einen “Anker”, d.h. Einen Referenzwert, von dem aus sie nach oben oder unten gehen.
Experiment - Merkmale und Designs
2 wesentliche Merkmale des Experiments:
- Manipulation der UV (min 2 Bedingungen) –> ändert sich die AV?
- Kontrolle der Störvariablen: sehr schwierig. Wenn das gelingt, gilt das Experiment als intern valide
Mögliche Designs:
- Einfaktoriell vs mehrfaktoriell (Anzahl der UV)
- Between-subjects vs within-subjects
- Enthält eine mehrfaktorielle Studie eine UV, die zwischen den Vpn manipuliert wird, und eine, die innerhalb von Vpn manipuliert wird, spricht man von einem gemischten Design.
zusätzliche Arten der Validität eines Experiments
- Ableitungsvalidität: erfasst das Ausmaß der korrekten Ableitung der theoretisch-inhaltlichen Hypothese bis auf die Ebene der Testhypothesen
- statistische Validität: beurteilt die die Güte der Auswahl und An- wendung statistischer Verfahren
- Präzision: erfasst die Wahrscheinlichkeit, mit der ein in der Population vorhande- ner Effekt durch die Untersuchung gefunden werden kann