HardestCardsQUEC Flashcards
Q: Was besagen Längsschnittuntersuchungen (longtitudinal designs)?
Welche Probleme können auftreten?
Längsschnittuntersuchungen (longtitudinal designs):
Gleiche Stichprobe zu mehreren Zeitpunkten untersucht (zB. 1990 5 jährige, 1995,2000,2015,2010)
Probleme:
- Unterscheiden sich die Stichproben nur in der interessierenden Variable (Alter), oder auch in anderer Hinsicht?
- Es tritt kein Selection bias auf – warum?
- Selektiver Ausfall (attrition / mortality): oft systematisch zB. in der IQ Untersuchung fallen die mit anfangs niedrigen Werten eher aus (positiver bias fürs alter)
- Testing: Wiederholt geteste Person werden besser in den Tests.
- Veränderung der Messinstrumente (test obsolence): Tests werden verändert (PISA 2003 vs PISA 2006 oder neue Diagnosemöglichkeiten)
- Dauer/Kosten: 10-50 Jahre Dauer
- Fundamentales Problem: Entwicklung über die Zeit – wird der Abstand zwischen 20 und 25 gemessen oder der Abstand zwischen 2011 und 2016? Ändert sich die Person oder die Umwelt?
Was untersuchen Querschnittsuntersuchungen (cross-sectional designs), wo ist das fundamentale Problem?
Querschnittsuntersuchungen (cross-sectional designs):
Untersuchung von Stichproben aus verschiedenen Altersgrupppen (zB. 20,30,40,50,60,70,80-jährige) -> Hauptrisiko Selection Bias
Probleme:
- Unterscheiden sich die Stichproben nur in der interessenden Variable (Alter), oder auch in anderer Hinsicht?
- Selection bias -> verschiedene Rekrutierungsmethoden für verschiedene Altersgruppen (Neugeborene in Klinik, Schulkinder, Berufstätige)
- Selektiver Ausfall von VPN: zB.wenn Aufgaben unterschiedlich schwierig für verschiedene Altersgruppen
- Schwierigkeit, Gruppen zu parallelisieren -> in Bezug auf Schulausbildung (Ältere hatten im vorherigen Jahrhundert in der Regel kürzere Ausbildungszeiten
Untersuchung von Alterseffekten:
Fundamentales Problem 1:
Konfundierung von Alter und Kohorte (Generation)
-Zum gleichen Zeitpunkt Untersuchte Menschen müssen unter verschiedenen Lebensbedingungen aufgewachsen sein
Fundamentales Problem 2:
Individuelle Entwicklung nicht untersuchbar (Generation):
-Age changes vs. Age difference -> Wer sagt, dass das schlauste Kind mit 6 auch noch mit 18 das schlauste ist
Q: Was versteht man unter Ökologischer Validität? Welche Arten von werden unterschieden?
Generalisierbarkeit des Forschungssettings:
- Ist die Laborumgebung generalisierbar auf die intendierte Alltagsumgebung (zB. Fahrsimulator vs. Fahren im realen Leben)
- Ist die Aufgabe generalisierbar auf die intendierte Umgebung? -> Lärmbewertung im Labor vs Lärmbelästigung bei der Arbeit
Validität des Untersuchungszeitpunkts
- Ist die historische Situation der Untersuchung auf andere Zeitpunkte generalisierbar? (Schülerleistung vor und nach PISA / Gedächtnisleistung in Klausurenphase) -> es gibt teilweise Experimentierverbote in der letzten Semesterwoche
Q: Was versteht man unter Stichprobenvalidität? Welche Arten von Stichproben werden unterschieden?
Stichproben Validität: Kann man vom Verhalten der Stichprobe auf die Zielpopulation verallgemeinern?
- *Idealvorstellung:** Die Stichprobe ist eine Zufallsauswahl aus der Population (random sampling)
- *Realistischer: Zielpopulation -**> verfügbare Population -> Stichprobe
Problem: 2 Generalisierungsschritte bedeutet 2 Fehlerquellen, was die Validität beeinflusst
Unterscheidung in 2 generelle Stichproben Risikofaktoren:
Leicht verfügbare Stichproben (samples of convenience):
Weiße Ratten
Psychologie Studierende
Freiwillige (in der Regel gebildet, höherer IQ, höhere Schicht)
RISIKO: Wechselwirkung zwischen treatment und Auswahl (sampling) -> Behandlung wirkt stärke/geringer in der Sub-Population
Klinische Stichproben:
Patienten die eine Therapie aufsuchen sind systematische anders als die intendierte Population der Betroffenen (Raucherentwöhnung vs Gesamtheit der Raucher)
Beispiel: Raucherentwöhnung 80-90% Rückfall nach einem Jahr -> widerspricht Erfahrung des erfolgreichen Aufhörens -> Hypothese: Lediglich die „verzweifelten“ Extremfälle
Q: Welche Gefahrenquellen für die interne Validität können beim Within-Subjects Design auftreten, welche beim Between-Subjects Design?
-
Reifung (maturation): meint alle Veränderungen über die Zeit; Ermüdung, Übung, Altern, Hunger
- zB. bei Pretest/Posttest Designs -> kann schon Trainingseffekt aufgetreten sein, sofern das gleiche getestet wird.
- LÖSUNG Kontrollgruppe ohne Treatment ( O1 X O2 & O1 O2)
-
Effekt der Testung (testing):
- bei Mehrfachmessungen verbessert sich die Leistung in späteren Tests (Vertrautheit mit Format/Gedächtnis)
-
Veränderungen in den Messinstrumenten (Instrument Decay)
- Bezieht sich auf physikalische ebenso wie menschliche Messinstrumente.
- Beispiele: 1. Analoge Eletronik (Aufwärmzeit) 2. Bei Personen Erfahrungswert: werden empfindlicher und klassifizieren Verhalten anders (zB. nach erstem psychotischen Schub Patienten -> werden Details ignoriert)
-
Regression auf den Mittelwert:
- Extremwerte tendieren bei nochmaliger Messung wieder zum Mittelwert. Dieser Fehler wird problematisch, wenn Extremgruppen untersucht. Denn gemäß der klass. Testtheorie schwankt jede Messung X mit einem Fehler e um den wahren Wert T. Daher können an sich „normale“ VP zufällig in die Extremgruppe kommen.
- Beispiel der VL -> Würfel
-
Geschichtliche Faktoren (history):
Historische Einwirkungen zwischen Vorher- und Nachhermessungen können das Ergebnis invalidieren. Daher darf zwischen den Messungen kein Ereignis stattfinden, dass Einfluss die Meinung der VPN hat. -
Auswahlverzerrungen:
Jeder systematische Unterschied zwischen Experimental und Kontrollgruppe macht die Messung ungültig.
Freiwilligkeit ist fast immer ein Problem! -> da so bestimmte Personengruppen sich eher melden als andere
Selection-Bias als generelles Problem -> es entstehen Quasi-Experimente ohne Randomisierung -
Differentieller Ausfall von VPN in bestimmten Gruppen (experimental mortality / differential attrition)
Differentieller Verlust von Versuchsteilnehmern in den verschiedenen Versuchsbedingungen (Gruppen) / Meist auf systematische Effekte zurückzuführen
zB. Raucherentwöhnung vs. Warteliste gruppe -> Aussteigen der stärksten Raucher propagiert Therapieffekt, der gar nicht da ist -
Diffusion:
Informationen vom Versuch kommen nach außen. zB. bestimmte Details aus der Treatmentgruppe gelangen in die Kontrollgruppe und die Probanden verhalten sich dann entsprechend (zB. bei Studenten sehr verbreitet, die sich von Versuchen erzählen) -
Rivalität zwischen Versuchsgruppen (compensatory rivalry)
zB. bei Pädagogischen Maßnahmen, ob spezielle Veranstaltungen den Studenten Vorteile bringen. Die Kontrollgruppe fordert dann ein Recht auf Gleichberechtigung und strengt sich entsprechend mehr an um den Unterschied wettzumachen. Die Effekte des treatments können so verloren gehen.
Q: Was bedeutet Interne Validität bei Versuchsplänen?
Es geht hierbei um Versuchspläne, bei denen VPn wiederholt getestet werden.
Ein Experiment ist „intern valide“ wenn der gemessene Effekt eindeutig auf die UV zurückzuführen ist.
Der Versuchsplan ist schlüssig, alle Störvariablen sind kontrolliert und Alternativerklärungen wurden ausgeschlossen.
Q: Erläutern Sie die Ihnen bekannten Versuchsleiter-Effekte und wie man für diese kontrolliert!
Versuchsleiter-Effekte:
Versuchsleiter-Erwartungs-Effekt(Rosenthal-Effekt)
VL erwartet bestimmten Ausgang (zB. Bestätigung der Sachhypothese) und kann VP unbeabsichtigt im Sinne dieser Erwartung beeinflussen
Beispiel: Grundlage -> Versuche von Rosenthal: Labyrinthaufgaben bei dummen/schlauen Ratten (die eigentlich gleich waren) je 6 bei 12 VL -> dumme Ratten schnitten dennoch schlechter ab, da sie anders behandelt wurden.
- *Kontrollmechanismen:**
1) Standardisierung des VB
2) Automatisierung / Durchführung ohne VL
3) Manipulation der VL Erwartungen
4) Training des VL auf nonverbale Kommunikation
5) Blinding des VL
Q: Erläutern Sie die Ihnen bekannten Versuchspersonen-Effekte und wie man für diese kontrolliert!
Erwartungen der Versuchsperson
Erwartungen wie eine experimentelle Bedingung wirkt
Erwartung der VP darf nicht mit der UV konfundieren (Beispiel: Wirkung eines Betäubungsmittels)
-> LÖSUNG: DoppelblindPlaceboVersuch: Eine Gruppe Treatment / Eine Gruppe Placebo -> VL wissen auch nicht, was sie den Probanden geben
Erwartungen aufgrund von Aufforderungsvariablen (demand characteristics):
VPn interpretieren alle Aspekte der Versuchssituation ->
Beispiel: Orne & Scheib: Sensorisches Deprivationsexperiment: Wenn vor Experiment medizinische Anamnese erhoben, Notfallkoffer in Sichtweise oder Panikknopf erklärt -> dann mehr Berichte über „Wände schienen zu wanken“ oder ähnliches -> LÖSUNG: geeignetes Setting finden
Erwartung über die soziale Erwünschtheit von Verhalten:
zB. Befragungen über Sexualverhalten / Antisemitismus
LÖSUNG: Aufklärung der Vpn, Lügenskalen; ‚faking-good’-Antworten; ‚Randomized-response’-Technik (statistisches Verfahren zur Schätzung der wahren Antworten);Bogus Pipeline (falscher Lügendetektor)
Motive der Versuchspersonen -> die Verhalten beeinflussen
- Testangst/Bewertungsangst
- Bedürfnis nach sozialer Anerkennung -> (positive self presentation -> Selbstdarstellungstendenzen) vgl. Versuch mit Hand in Eiswasser
Q: Welche Probleme können bei Beobachtungen auftreten? Und wie können diese gelöst werden?
Probleme bei Beobachtungen:
-> Reaktivität der Messung (observer Influence)
Beobachter hat Einfluss auf das Geschehen
Beobachtungsstudien sind relativ (Observer influence)
Versuchspersonen verhalten sich anders, wenn ein Beobachter anwesend ist
Lösungsversuch 1 Habituieren
- \>d.h. es wird regelmäßig gefilmt oder beobachtet, die VPs achten so irgendwann nicht mehr drauf (wie Big Brother)
Lösungsversuch 2 Unwissentlich beobachten
-\>Problem hier sind die Ethischen Grenzen! (Daher seltener verwendet)
Verzerrung durch den Beobachter (observe bias)
Beobachtet das, was er beobachten möchte oder sich wünscht/erhofft (Ist der Beobachter ein gutes „Messinstrument“?)
Lösungsversuch 1 Blinding (Blindversuch)
->Beobachter kennt die echte Hypothese nicht
Lösungsversuch 2 Spezifische Kategorien
->Um so spezifischer die Hypothese gestellt ist, desto weniger kann man sie verfälschen
Beispiel:
lost letter technique‘ -> „Objektiv“
Milgram: Briefe wurden verstreut und waren an unterschiedliche Gruppen (Privat/med. Einrichtungen ; Nazis/Kommunisten) adressiert
Wieviele von den Briefen wurden aufgesammelt und in US Mailbox getan?
Q: Was machen gute erfahrungswissenschaftliche Theorien aus?
Folgende Forderungen werden an erfahrungswissenschaftliche Theorien gemacht und dienen zugleich als Kriterium für den Vergleich von Theorien!
1. **Widerspruchsfreiheit (**einfach bei axiomatischen Theorien, schwieriger bei psychologischen) 2. **Präzision:** Quantitative Theorien (mathematische Formeln) besser als eine qualitative 3. **Einfachheit** (Ockams Rasiermesser): Die weniger komplexe Theorie ist besser 4. **Objektivierbarkeit:** Keine Introspektion (Selbstbeobachtung), keine Interpretation, Begriffe müssen operationalisierbar sein -> zB. Durch physiologische Maße 5. **Empirischer Gehalt:** Die Theorie mit dem größten empirischen Gehalt ist besser 6. **Falsifizierbarkeit (Kritisierbarkeit)** -> Theorie muss im Prinzip Falsifizierbar sein, außer sie macht Ausnahmen (zB: Ödipuskomplex)
POWEEF
Q: Erläutern Sie die Grundzüge des Logischen Positivismus (Wiener Kreis) Welche Wissenschaftstheorie lag zu grunde? Was besagt das Sinnkriterium?
- M. Schlick -> Physiker + Philosoph
- L. Carnap -> Philosoph
- B. Russell -> Mathematiker / Philosoph
- L. Wittgenstein -> Philosoph
- K. Gödel -> Mathematiker
- > Versuchen mit Mitteln der Logik und Erkenntnistheorie zu spezifieren, wie man sinnvolle empirische Wissenschaft erkennt
Kernaussagen:
- Reduktion der Philosophie auf Wissenschaftstheorie (dh. Übrige Gegenstände fallen weg)
- Aufspaltung der Wissenschaften in 2 Klassen (vgl. D. Hume)
1. Analytische (Logik & Mathematik)
2. Synthetische (alle empirischen) - ‚Logizismus‘ (Mathematik auf Logik reduzieren)
- ‚Physikalismus‘ alle empirischen Disziplinen auf die Physik reduzieren -> inklusive deren Methoden
- > Wie begründet man Erkenntnisse in der Wissenschaft? -> Wissenschaftstheoie Wiener Kreis
Wissenschaftliche Aussagen müssen verifiziert werden (Verifizierbarkeit) -> Sinnkriterium
- Nur Aussagen, welche man verifizieren kann sind sinnvoll -> auf gegebenes zurückführen
- Aussagen, die nicht verifizierbar sind, sind folglich sinnlos. BEISPIEL?
- Empirische Aussagen müssen letztlich auf erlebnismässig gegebenes rückführbar sein
- Das wird in Form von Protokollsätzen (Neurath) festgehalten
- > „Wissenschaftler X hat zum Zeitpunkt t,dieses und jenes wahrgenommen“ Beispiel Ellermeier (Akustikexperiment)
Q: Was versteht man unter einem Test? Nennen Sie die zentralen Testgütekritierien nach der klassischen Testtheorie! Was bedeuten sie?
Befragung :
- Mündliche Befragung
- Schriftliche Befragung
- Internet Befragung
Ein Test ist ein standardisiertes Verfahren zur Messung latenter Variablen. Er genügt bestimmten Testgütekritieren.
Testgütekriterien:
- Objektivität: Ergebnis muss unabhängig vom Testleiter sein
- Reliabilität: Zuverlässigkeit / Messgenauigkeit: wie genau der Test das misst, was er misst (egal was er misst)
- Validität: Ausmaß, in dem der Test das misst, was er messen soll.
Q: Nennen Sie die ihnen bekannten Definitionen von klassischen Experimenten:
_Definition nach Mill -> Feststellung von Kausalität: _
- Die Ursache muss dem Effekt vorausgehen
- Die Ursache muss mit dem Effekt zusammenhängen-> es gibt eine plausible Verknüpfung
- Es darf keine alternativen Erklärungsmöglichkeiten als die Ursache geben (!)
_Definition von Wundt: _
-Experiment = Willkürliche Einwirkung auf Beobachtung
3 Ws von Wundt
-Willkürlichkeit -> Absichtliche, planmäßige Herbeiführung des Ergebnisses unter kontrollierten Bedingungen
-Wiederholbarkeit -> Reproduzierbarkeit der Ausgangsbedingungen und Ergebnisse
-Variierbarkeit -> Einflussgrößen können in verschiedenen Ausmaßen eingesetzt werden
Q: Fassen Sie die wesentlichen 3 Möglichkeiten der Kontrolle im Experiment zusammen!
- Über die UV: Alle VPn werden auf identische Weise manipuliert. Manchmal kommen hierzu „Konföderierte“ zum Einsatz, also Eingeweihte des Versuchsleiters. Hierzu zählt aber auch Kalibrierung etc.
- Über potentielle Störvariablen (Lärm, Tageszeit): Störvariablen werden idealerweise eliminiert, ansonsten versucht, konstant zu halten oder durch Randomisieren zu entkräften.
- Über Unterschiede zwischen VPn: Hierbei werden Randomisieren oder Matching im Falle des between-subjects design und alle Versuchsbedingungen in jeder Reihenfolge (ABBA, Ausbalancieren) im within-subjects design verwendet.
Q: Wie wird eine Untersuchung durchgeführt? Was muss bei den einzelnen Schritten beachtet werden?
- Spezifizieren von Hypothesen
- Auswahl einer Population&Stichprobe
- Operationalisierung der UV
- Operationalisierung der AV -> Skalen / physiologische Maße
- Versuchsplan erstellen:
- M /R
- Beobachtung O
- Treatment X
- Durchführung des Experiments
- Statistische Interpretation
- Veröffentlichung im APA Format