Evaluationsforschung Flashcards

Question

Beschreibung von Veränderungen

Answer 1

Differenzen auf Einzelfallebene: Normvergleiche, Prozentränge, Standardisierung der Differenz Differenzen auf Gruppenebene: - Intradindividuelle Veränderung -- individuelle Differenzen berechnen und mitteln (abhängige Stichproben) - interindividuelle Veränderung -- Vorher- und Nachher-Werte mitteln und mittlere Differenz berechnen (unabhängige Stichproben) - Statistische Tests für Gruppenvergleiche -- t-Tests, ANOVAs Häufigkeitsaussagen auf Populationsebene: Beispiel: Veränderung in Inzidenz --> Veränderungsquotient (VQ = (I2 - I1)/I1) --> bei bekannter Anzahl der Gesamtmessungen auch Signifikanzprüfung möglich Trendanalyse: - Regressionsanalyse mit mehreren Messzeitpunkte als Prädiktoren --> Feststellen der Form/ des Verlaufs der Veränderung; linearer oder quadratischer Trend, kubisch, höhere Ordnung, Kombinationen? (Verlauf des Merkmals im Laufe der Zeit) - Zeitreihenanalyse --> Regressionsanalyse mit vergangen Messwerten als Prädiktoren (wichtig: Entfernung serieller Abhängig (Prewhitening) vor der Anwendung statistischer Tests)

Answer 2

Hintergrund: Erlassung der Gesetze zur teilweisen Einschränkung des Rauchens im öffentlichen Bereich und im Gastgewerbe (zwischen August 2007 - Juli 2008) —> Effekt auf koronare Herzerkrankungen Methode: Vorher-Nachher-Studie & Trendanalyse - Versicherungskohorte von 3,7 Mio. Personen ab 30 Jahren - Ergebnismaße: Krankenhauseinweisungsraten, Krankenhauskosten —> Prognose beider Variablen unter fehlenden Effekt der Gesetze (durch ermittelten Trend) und Vergleich der tatsächlichen Messung mit der Prognose => mutmaßlicher Effekt des Gesetzes auf die abhängige Variable Ergebnis: Unter Annahme, dass das Gesetz den beobachteten Rückgang verursacht hat, konnten im Jahr nach der Umsetzung des Gesetzes 1880 Krankenhauseinweisungen vermieden und 7,7 Mio. Euro an Kosten gespart werden.

Answer 3

Direkte Veränderungsmessung = Erfassung der Veränderung in einer Messung - z.B., Befragung - Mögliche Verzerrungen: Konfirmationsbias, selektive Informationsverarbeitung, Assimilation/Kontrast Indirekt Veränderungsmessung = zwei Messungen und Differenzbildung - z.B., Zustandsevaluationen und Differenzbildung - Mögliche Verzerrungen (vgl. Probleme bei Messwiederholung): Erinnerungseffekte, Übungseffekte, Sensibilisierung

Answer 4

Ist eine Veränderungsanalyse generalisierbar? —> Überprüfen auf mögliche Moderatoren Mögliche Moderatoren: - Subgruppen (alt/jung, Gymnasium/Gesamtschule) - Kontextbedingungen (Raum-zeitlich, Organisation, gesellschaftlich)

Answer 5

Wirkung = Ergebnis einer Ursache Wirksamkeit = Ausmaß des Erfolgs (—> Fähigkeit eine bestimmte Wirkung hervorzubringen) Wirkmodell = zu prüfende Theorie/Hypothese über Wirkmechanismus

Answer 6

Grundlagenebene — Theorie ist unzutreffend/unpräzise (z.B., werden wichtige Randbedingungen nicht berücksichtigt) Technologische Ebene — Theorie stimmt, aber Übertragung auf Intervention nicht zulässig (z.B., bei konstanten, nicht beeinflussbaren Variablen) Implementationsebene — Theorie stimmt, aber die Umsetzung der Intervention (konkrete Realisierung der theoretischen Variablen) war fehlerhaft Evaluationsebene — es kam zu Fehlern bei Wirkungsprüfung (z.B., Messfehler, Design)

Answer 7

Persistenz = Beständigkeit der Wirkung der Maßnahme - Wirkung hält nach Abschluss der Maßnahme an - Wiederholung der Post-Messung in Follow-up-Messungen - Mögliche Ergebnisse: stabil, Verlust, Gewinn Transfer = Generalisierbarkeit der Wirkung der Maßnahme - Wirkung reicht über den Gegenstandsbereich der Maßnahme hinaus - Wirkung tritt auch im Alltag (außerhalb der Maßnahme) auf - Anforderungstransfer = Generalisierbarkeit der Wirkung auf andere Anforderungen (z.B., R-Computerkurs führt zu Verbesserung in Statistikfähigkeiten) - Situationstransfer = Generalisierbarkeit der Wirkung auf andere Kontexte/Situationen (z.B., Training als Mediator verbessert private soziale Interaktionen)

Answer 8

Hauptwirkung = intendierte, maßnahmenspezifische Wirkung laut Wirkmodell Nebenwirkung = nicht intendierte Wirkung, die gleichzeitig auftritt (positiv -> die Hauptwirkung stärkend // negativ -> die Hauptwirkung schwächend) Folgewirkung = nicht intendierte Wirkung, die später auftritt Bruttowirkung = Summe aller Wirkungen (= Hauptwirkung + Nebenwirkung + Folgewirkung + Maßnahmenunspezifische Effekte (evtl. intendierte, aber nicht maßnahmenspezifische Effekte) + externe Effekte (konfundierte Variablen)) Nettowirkung = Hauptwirkung + Nebenwirkung + Folgewirkung

Answer 9

- dient Handlungsoptimierung in komplexen Situationen - liefert Beitrag zum Entscheidungsprozess bzgl. Auswahl von Verhaltensalternativen Eine generelle, ideale Handlungsalternative ist oft nicht existent oder nicht identifizierbar. --> Suche nach optimaler Handlungsalternative für den konkreten Fall

Answer 10

Im engeren Sinne: Evaluation einer Evaluation --> Bewertung der Qualität einer Evaluationsstudie Im weiteren Sinne: Integration von Evaluationen --> Metaanalyse von Evaluationsstudien zu einem Gegenstand (Kommen alle Studien zu gleichen Schlussfolgerung? Wie kann die wahre Effektgröße am besten geschätzt werden?)

Answer 11

Im engeren Sinne: Evaluation einer Evaluation --> Bewertung der Qualität einer Evaluationsstudie Im weiteren Sinne: Integration von Evaluationen --> Metaanalyse von Evaluationsstudien zu einem Gegenstand (Kommen alle Studien zur gleichen Schlussfolgerung? Wie kann die wahre Effektgröße am besten geschätzt werden?)

Answer 12

Ergebnisorientierte Ansätze - Wirksamkeitsorientierte Ansätze (Vier Formen der Asymmetrie von Wittmann, 1990) - Effizienzorientierte Ansätze Systemische Ansätze - z.B., CIPP-Modell von Stufflebeam, 1971 als Evaluationsmodell Theorieorientierte Ansätze - Theoriegeleitete Ansätze - Realistische/Praxisorientierte Ansätze Akteursorientierte Ansätze - Klientenorientierte Ansätze - Stakeholderorientierte Ansätze

Answer 13

(1) Funktion der Evaluation (Zustand, Veränderung, Wirksamkeit) (2) Ziele und Bewertungskriterien der Beteiligten (3) Evaluationsebenen (Reaktion, Lernen, Verhalten, Ergebnisse) (4) Welche Arten von Daten (Kontext, Input, Prozess, Produkt)? (5) Zeile der Programmtheorie explizit? (6) Welche Ressourcen?

Answer 14

5 Datenboxen für evidenzbasierte Interventionen: Alle Boxen sind als Cattell'sche Kovarianz-Boxen dargestellt und umfassen die Dimensionen Personen, Variablen und Messzeitpunkte. Die Datenboxen sind auf einer Zeitachse angeordnet, die dem Ablauf eines Evaluationsprozesses entspricht. - PR-Box = predictor box (vor Intervention) -- Ausgangslage vor der Implementierung; Ausprägung der später als Kriterien verwendeten Variablen (Bedürfnisse der Betroffenen); ggf. Prädiktoren für die Wirksamkeit einer Maßnahme - ETR-Box = experimental treatment box (während) -- beinhaltet eine experimentelle Evaluation zwecks Bewertung der Maßnahme - NTR-Box = non-experimental treatment box (während) -- versteht Evaluation als nicht-experimentellen Bewertungsprozess in Form von Quasi-Experimenten, korrelativen Messungen, Meinungsurteilen - CR-Box = criterion box (nach Intervention, summativ) -- enthält alle Kriterienmaße, die zur Evaluation der festgelegten Ziele dienen und deren zeitlichen Verlauf erfasst an Personen, Gruppen oder Institutionen - EVA-box = evaluator box (Stakeholder-Interessen) -- Rahmenbedingungen für die Evaluaton, Ziele & Interessen der Stakeholder, Ressourcen

Answer 15

Nordwest-Pfad (über ETR-Box): Interne Validität steht im Vordergrund; Reformen als Experimente; kausale Aussagen möglich --> Efficacy = Wirksamkeit unter Idealbedingungen --> Quasiexperimente (geplante, randomisierte Zuweisung; aktive UV-Manipulation) --> Hauptvertreter: Donald T. Campbell Südwest-Pfad (über NTR-Box): Externe/ökologische Validität im Vordergrund; Evaluation soll möglichst den realen Bedingungen der Intervention entsprechen; Generalisierbarkeit --> Effectiveness = Wirksamkeit unter Alltagsbedingungen --> Korrelationsstudien (keine geplante, randomisierte Zuweisung; keine aktive UV-Manipulation; Möglichkeit zur Generalsierung) --> Hauptvertreter: Lee J. Cronbach

Answer 16

Rahmenkonzeption zur Analyse des menschlichen Urteilsverhaltens Grundprinzip: Theoretischer Ansatz, der skizziert, wie wir in einer probabilistischen Welt aus unseren Beobachtungen Schlüsse ziehen. Auf der linken Seite der Linse stehen distale Zustände der Welt ("e"), die über proximale Hinweisreize ("cues"; Linse), erfahrungsbezogener Gewichtung sowie momentanem subjektivem Eindruck im kognitiven System zu einem Urteil ("s"; rechts) zusammenfließen. --> Die Urteilsgenauigkeit wird gemessen als die Korrelation r(Ye, Ys)

Answer 17

Zwischen PR und CR bei Wirksamkeitsevaluation und zwischen ETR und CR bei Programmevaluation. Symmetrie zwischen Ausgangslage, Intervention und Kriterienbereich ist eine unverzichtbare Grundlage der Evaluation. Zwei beliebige Datenboxen können über die Linsengleichung auf ihren Zusammenhang überprüft werden (r(true) zwischen zwei spiegelsymmetrischen Elementen im Linsenmodells (gleiche Position im Hierarchiemodell) sollte 1 sein; z.B., r(PR6, CR6)). Linsengleichung: r(PR,CR) = G(PR,CR) * Wurzel aus (r(PR)*r(CR)) * R(PR) * R (CR) * S + e r(PR,CR) = beobachtete/interessierende Effektgröße (Korrelation zwischen PR und CR) G(PR,CR) = wahre Effektgröße (wahre Korrelation zwischen zwischen PR und CR) r = psychometrische Reliabilität von PR und CR (r<1 --> Mangel an Zuverlässigkeit) --> 2 Gefahren der Unterschätzung R = Konstruktreliabilität von PR und CR (R<1 --> Mangel an Symmetrie) --> 2 Gefahren der Unterschätzung S = Selektionseffekte (Stichprobenstreuung > Populationsstreuung -> 1 Gefahr der Überschätzung // Stichprobenstreuung < Populationsstreuung -> 1 Gefahr der Unterschätzung) e = Stichprobenfehler (positiver Fehler --> 1 Gefahr der Überschätzung // negativer Fehler --> 1 Gefahr der Unterschätzung) Insg. 6 Gefahren der Unterschätzung und 2 Gefahren der Überschätzung Alle Datenboxen können in ihrem Zusammenhang untereinander mit dieser Gleichung analysiert werden. Die unterschiedlichen Korrelationskoeffizienten des Zusammenhangs zur Kriterienbox stellen Varianten von Effektgrößemaßen dar, die in Metaanalysen verwendet werden. --> Durch die Anwendung der Linsengleichung kann der Symmetrie zwischen den Daten boxen analysiert werden.

Answer 18

= Evaluationsstandards der Deutschen Gesellschaft für Evaluation - Nützlichkeit - Durchführbarkeit - Fairness - Genauigkeit

Answer 19

= Standards zur Ausrichtung an geklärten Evaluationszwecken sowie am Informationsbedarf der Nutzer*innen - Identifizierung der Beteiligten & Betroffenen - Klärung der Evaluationszwecke - Glaubwürdigkeit und Kompetenz der Evaluator*innen - Auswahl und Umfang der Informationen (-> Fragestellung & Informationsbedarf des Auftraggebers) - Transparenz von Werten - Vollständigkeit und Klarheit der Berichterstattung - Rechtzeitigkeit der Evaluation - Nutzung und Nutzen der Evaluation

Answer 20

= Standards zur Sicherstellung einer realistischen, gut durchdachten, diplomatischen und kostenbewussten Planung und Durchführung - Angemessene Verfahren (Belastung zu Nutzen Verhältnis) - Diplomatisches Vorgehen (hohe Akzeptanz) - Effizienz von Evaluation (Aufwand zu Nutzen Verhältnis)

Answer 21

= Standards zum respektvollen und fairen Umgang mit den betroffenen Personen(-gruppen) - Formale Vereinbarungen - Schutz individueller Rechte (Sicherheit, Würde und Rechte) - Vollständige und faire Überprüfung (des Evaluationsgegenstands) - Unparteiische Durchführung und Berichterstattung - Offenlegung der Ergebnisse

Answer 22

= Standards zur Er-/Vermittlung gültiger Informationen und Ergebnisse zu Evaluationsgegenstand/-fragestellungen - Beschreibung des Evaluationsgegenstands - Kontextanalyse - Beschreibung von Zwecken und Vorgehen - Angabe von Informationsquellen - Valide und reliable Informationen (Zuverlässigkeit und Gültigkeit der Daten; Gütekriterien quantitativer und qualitativer Sozialforschung) - Systematische Fehlerprüfung - Analyse qualitativer und quantitativer Informationen - Begründete Schlussfolgerungen - Metaevaluation