Altfragen Flashcards
Nennen und skizzieren Sie die drei Einflussfaktoren, die die interne Validität bei nicht randomisierten und nicht repräsentativen Stichproben einschränken können.
I) Selektion
Schließt Leute nach bestimmten Merkmalen aus z.B. können Leute, die sich freiwillig für Teilnahme melden, andere Eigenschaften haben als eben die, die es nicht tun
II) Mortalität
Die Stichprobe wird von Messzeitpunkt zu Messzeitpunkt immer kleiner, weil die Probanden nach längerer Zeit nicht mehr durchhalten
III) Regression
Extremwerte mitteln sich bei wiederholter Messung z.B. werden Menschen mit extremen Depressionswerten im Vortest mit höherer Wahrscheinlichkeit weniger starke Depressionswerte bei einem Follow-Up erzielen. Ein besserer Mittelwert heißt nicht, dass die Depressiven sich besser fühlen und die nicht depressiven sich dann schlechter fühlen.
Erklären Sie warum Reifung bei den Programmteilnehmern eine Alternativerklärung für Veränderungen darstellt und wie man diese kontrollieren könnte.
> Reifung bewirkt Veränderungen, die nicht auf das Programm zurückzuführen sind. Kontrolliert man sie nicht, kann man also die Programmwirkung nicht spezifisch erkennen.
> Kontrolle am besten über den Vergleich mit entsprechenden nicht-behandelten Kontrollgruppen.
Arevey und Cole (1989) sowie Millsap und Hartog (1988) beschreiben drei Arten von Veränderungen in “Pretest-Posttest Designs” in Bezug auf die Konstruktvalidität. Nen-nen Sie die drei Arten und beschreiben Sie kurz, was sich hinter den Begriffen verbirgt.
- Alpha-Change: Reale Veränderung in der interessierenden Variable
- Beta-Change: Veränderung im Verständnis der Skala durch die Befragten
- Gamma-Change: Veränderung des Konzept der erfassten Variable durch die Befragten
Nichtexperimentelle Evaluationsdesigns mit nur einer Gruppe sind in ihrer Aussage-kraft bzgl. Kausalität bzw. der Frage danach, ob wirklich das Programm/die Interventi-on einen Effekt hat, durch Probleme mit der internen Validität eingeschränkt. Den-noch sind sie manchmal sinnvoll. Nennen sie drei Fragestellungen bzw. Ziele, für die ein Evaluationsdesign mit nur einer Gruppe sinnvoll sein kann!
1) Den Nutzen weiterer Evaluation einschätzen: Ist es sinnvoll, noch weitere Evalua-tionsstudien anzusetzen?
2) Verbesserungen mit anderen Variablen korrelieren: Gibt es neben der erzielten Wirkung noch Veränderungen in anderen Bereichen?
3) Einrichtungen für weitere Evaluationen vorbereiten: Personal soll die Idee einer Evaluation akzeptieren, damit die Evaluatoren dann leichtes Spiel haben.
Bei der Evalutation eines Psychotherapieprogramms soll untersucht werden, ob mehr Behandlungseinheiten mit einer größeren Veränderung im Befinden der Teilnehmer einhergehen. Dafür wird der residualisierte Veränderungsscore des Befindens (residua-lized change score) mit der residualisierten Anzahl der Behandlungseinheiten (residual of number of sessions) korreliert. Es ergibt sich ein Wert von 0.72. Wie lässt sich dieser Wert interpretieren? (Siehe Seite 146)
Der Wert indiziert, dass diejenigen Probanden eine stärkere Verbesserung erzielt haben, die mehr Therapiesitzungen erhalten haben, selbst, wenn man die Unterschiede im Pre-test-Score berücksichtigt.
Nennen Sie 3 Strategien zur Kontrolle der Gefahren für die Konstruktvalidität
1) Informationen, die für die Evaluation gesammelt wurden, von denen unterscheiden, die für Behandlungsentscheidungen gesammelt wurden.
2) Befragte glauben machen, dass ihre Antworten in irgendeiner Form validiert werden
3) Interviewer nehmen, die sowohl mit dem Programm als auch mit den Problemen der Befragten vertraut sind.
Ergebnisevaluation kann es je nach Methode des Datengewinns zu Testeffekten kommen, die die interne Validität einschränken. Ein weiteres Problem stellt in diesem Zusammenhang die Instrumentation dar. Nennen Sie ein Beispiel für Instrumentation.
Bei der Gewinnung von Daten für nicht-experimentelle
Ein Lehrer bekommt während der Beurteilung von Klassenarbeiten mehr Erfahrung und bewertet die folgenden immer ein bisschen schlechter.
Was bezeichnet der Begriff “interne Validität”?
Interne Validität ist dann gegeben, die Veränderung einer abhängigen Variable eindeutig durch eine unabhängige Variable erklärt werden kann.
Nennen Sie, wie die Gefahr des Zeitlichen Einflusses (“History”) für die Interne Validität hinsichtlich einer Evaluation isoliert werden kann und erläutern Sie kurz, warum das Konstrukt des Zeitlichen Einflusses eine niedrigere Vorhersagbarkeit und Stabilität aufweist als die Reifung von Programmteilnehmern.
Reifung sind natürliche Veränderungen in Personen aufgrund eines bloßen Verstreichens der Zeit, wohingegen History Ereignisse bezeichnet, die zwischen Vor- und Nachtest auf-treten und die Programmteilnehmer beeinflussen
Kontrolle: Kontrollgruppen, Mehrere Testzeitpunkte
Stabilität: Historische Ereignisse können jederzeit passieren, man kann sie nicht vorhersagen. Reifungseffekte sind oftmals an Lebensphasen gebunden (z.B. beim Heranwach-sen)
Wie kann gezeigt werden, dass es einen kausalen Zusammenhang zwischen zwei Ereignissen gibt?
Demonstration eines kausalen Zusammenhangs in quasiexperimentellen Settings: 3 Bedingungen müssen erfüllt sein
1) Ursache geht angenommenem Effekt zeitlich voraus
2) Ursache kovariiert mit dem Effekt (z.B. je mehr der Ursache, desto mehr des Effektes)
3) außer der angenommenen Ursache gibt es keine weitere Erklärung für den gefundenen Effekt (Ausschluss von Alternativerklärungen)
Welche vier charakteristischen Minimalbestandteile machen Zeitreihendesigns aus?
1) Eine Einheit wird definiert (z.B. eine Person, Nation, Gruppe)
2) Quantitative Datenerhebung
3) Über mehrere Zeitintervalle hinweg
4) Geht voraus oder folgt einer kontrollierten oder natürlichen (?) Intervention.
Erläutern Sie kurz, warum Zeitreihendesigns im Vergleich zu einer einfachen Pre-/Posttest-Messung besser geeignet sind, um Reifungseffekte von tatsächlichen Pro-gramm- bzw. Interventionseffekten zu unterscheiden!
Durch gleichzeitiges prä- und post-Testen der Vergleichsgruppen können Reifungseffekte einfach nachvollzogen und somit kontrolliert werden.??????
FALSCHE ANTWORT?
Was ist das Control Construct Design (McKillip und Baldwin 1990) und was ist die Be-dingung für dieses Design?
Es werden zusätzliche abhängige Variablen erhoben, bei denen keine Veränderung er-wartet wird. Diese Variablen müssen genauso wie die betrachtete abhängige Variable gemessen werden.
Nicht äquivalente Kontrollgruppen nennt man auch Vergleichsgruppen. Erläutern Sie kurz eine mögliche Schwierigkeit, die bei der Selektion der Vergleichsgruppe auftreten kann anhand eines selbst ausgewählten Beispiels!
-> KG sollte der Experimentalgruppe gleichen (matchen)
o Bzgl. der Reifung
o Bzgl. gleicher Prätest Ergebnisse
o Bzgl. der Lebensart
o Regression zur Mitte: Zweitklässler verbessern sich hinsichtlich des Mittelwerts von Drittklässlern. Diese Regression zur Mitte lässt die Verbesse-rung der Zweitklässler dann schwächer aussehen, obwohl das Programm sie beeinflusst hat.
Nennen Sie drei Methoden, die nach Campbell und Stanley ein Quasi-Experiment aus-zeichnen!
1) Beobachtungen zu mehreren Zeitpunkten
2) Beobachtung von zusätzlichen Gruppen
3) Beobachtung anderer abhängiger Variablen
Um die Ergebnisse von Studien eindeutiger interpretieren zu können, können unter-schiedliche quasieexperimentelle Ansätze kombiniert werden. Welche beiden Ansätze werden bei dem von Cook und Campbell benannten „interrupted time series with swit-ching replications“-Design verwendet?
1) Die Beobachtung an zusätzlichen Erhebungszeitpunkten
2) Die Beobachtung einer geeigneten Kontrollgruppe.
Im nichtäquivalenten Kontrollgruppen Design werden sowohl die Kontrollgruppe als auch die Experimentalgruppe in gleicher Weise getestet und sind somit in gleicher Wei-se bestimmten Störeinflüssen ausgesetzt. Nennen Sie 3 dieser Einflüsse, die beide Gruppen gemeinsam haben?
1) Hat auch Reifung und History erfahren (konstant halten)
2) Wird zu gleichen Zeitpunkten gemessen: Testeffekte gleich
3) Mortalität kann angeglichen werden
Definieren Sie in Ihren eigenen Worten, was ein nichtäquivalentes Kontrollgruppen-Design ist.
Neben mehreren Testzeitpunkten mehrere Testgruppen einführen: interne Validität weitestgehend gesichert
Hager und Hasselhorn (2000) geben einen Überblick über “die allgemeinen Gütekrite-rien für Interventionsmaßnahmen mit dem Anspruch der Generalisierung oder des Transfers”. Nenne sechs der insgesamt 10 Grundsätze.
1) Ethische Legitimierbarkeit
2) Theoretische Fundierung
3) Wirksamkeit oder Effektivität
4) Fehlen von negativen Neben-/Folgewirkungen
5) Bewährung in der Praxis
6) Verlässlichkeit der Wirksamkeit
7) Robustheit
8) Wirtschaftlichkeit relativ zu den Zielen
9) Routinisierbarkeit und Adaptabilität
10) Akzeptanz und Zufriedenheit mit der Maßnahme
Grenze die Begriffe “Performanz” und “Kompetenz” voneinander ab.
> > Der Performanzbegriff bezieht sich ausschließlich auf das konkret beobachtbare Ver-hal-ten bzw. auf die durch Beobachtung erfassbare Leistung von Personen beim Be-arbeiten einer Anforderung.
> > Kompetenz ist ein Erklärungskonstrukt, mit dessen Hilfe Performanzen erklärt wer-den können.
> > Das Konstrukt Kompetenz ist dem Konstrukt der Performanz daher übergeordnet.
Grenze die Begriffe Nettowirkungen und Bruttowirkungen (hier: im weiteren Sinne) kurz und in eigenen Worten voneinander ab! (S.48)
> > Die Nettowirkung bezeichnet alle Wirkungen, die auf das Programm selbst zurückzu-führen sind, also die programmgebundenen Wirkungen einschließlich der Neben- und Folgewirkungen.
> > Unter Bruttowirkung im engeren Sinne versteht man alle Wirkungen, die vom Pro-gramm und von der Interventionssituation ausgehen und zwar einschließlich der auf wiederholte Durchführung von Tests- und Beobachtungsverfahren zurückführbaren Wirkungen.
> > Unter Bruttowirkung im weiteren Sinne subsumiert man alle Wirkungen, die im Ge-folge einer Intervention auftreten können: die programm-, die interventionsgebun-denen und die interventionsunabhängigen Wirkungen.
Was ist mit dem Begriff “Übung” gemeint?
Übung ist die wiederholte, aktive und lösungsorientierte Auseinandersetzung mit den Aufgaben einer Interventionsmaßnahme als Eigenleistung der Adressat_innen der Maß-nahme
Grenze die Begriffe Wirksamkeit und Wirkung kurz und in eigenen Worten voneinan-der ab!
I) Wirksamkeit:
… wenn beobachtbare Performanzen oder Leistungen durch ein Interventionsmaßnahme beeinflusst werden, und zwar in der von den Vertretern des Programmes behaupteten Weise.
II) Wirkungen:
… theoretisch angenommene Ursache der beobachtbaren Verhaltensänderungen
Erklären Sie kurz und in eigenen Worten programmgebundene, interventionsgebunde-ne und externe Wirkungen eines Programms. (S.45)
1) Programmgebunden:
Folge der spezifischen Charakteristiken des durchgeführten Interventionsprogrammes
2) Interventionsgebunden:
Veränderungen, die auf die bloße Tatsache zurückgeführt werden können, dass eine Intervention stattgefunden hat, unabhängig davon, wie diese Intervention im einzelnen ausgesehen haben mag.
3) Extern / fakultativ:
Als fakultativ sehen wir alle jene Ziele an, die weder zu den internen noch zu den verbindlichen externen Zielen zählen und die extern, also von einer Außeninstanz vorgegeben werden.