Metaanalyse Flashcards
Was ist eine Metaanalyse?
= Gruppe von Verfahren zur systematischen quantitativen Zusammenfassung von Untersuchungsergebnissen
Zusammenfassung von Primärstudien eines Themas zu Metadaten mithilfe statistischer Mittel
–> Forschungssynthese, Interpretative Aggregation zu einer Gesamtaussage, Studien als Untersuchungseinheit
Bei der Metanalyse wird nicht mit den Originaldatensätzen gearbeitet, sondern ausschließlich mit mit den Ergebnisberichten der Primärstudien.
Narratives Review vs. systematisches Review vs. Metaanalyse
+ Vorteile der Metaanalyse
Narratives Review (literature review): Vorstellung/Vergleich/kritische Diskussion der einschlägigen Literatur
Systematisches Review: kritische Würdigung früherer Forschungsdaten
–> Problem: begrenzte kognitive Kapazitäten & Subjektivität und Intransparenz
Metanalyse: Rechnerische Zusammenfassung von statistischen Befunden (Effektgrößen)
- transparente Regeln für Suche nach Studien
- festgelegte Kriterien für Inklusion/Exklusion
- Angabe & Definition der Kriterien und Vergleichsdimensionen
- intersubjektiv nachvollziehbare Kodierung von Studien und Moderatorvariablen & Gewichtung und statistische Analyse der Studienergebnisse
Nachteil: Kriterien verringern Anzahl der aufgenommenen Studien
Beispiele für den Erkenntnisgewinn durch eine Metaanalyse
- gleicht Unsicherheiten (A und B Fehler) in Primärstudien aus –> “Mittelwert” aus bisherigen Studien zum einem Gegenstandsbereich
- kann Problem einer niedrigen Teststärke lösen (großer, unvermeidbarer B Fehler in Primärstudien)
-> liefern wissenschaftliche Grundlage für Entscheidungen im Anwendungskontext
-> wichtiger Schritt von der Grundlagenforschung zur technologischen Forschung & Anwendung
Ziele der Metaanalyse
Gesamteffekt = gewichteter Mittelwert der Effektgrößenmaßen der einzelnen Primärstudien welcher den Gesamteffekt in der Population schätzt
–> Signifikanztest für den Gesamteffekt
–> Effektgrößenschätzung des Gesamteffekts (Punkt- & Intervallschätzung)
Moderatorvariable = Variable C, von der abhängt, wie der Effekt einer Variable A auf eine Variable B ausfällt
–> kategoriale oder kontinuierliche Moderatorvariable
–> Moderator-/Subgruppenanalyse = Identifikation derjenigen Moderatoren, die den Effekt stärker oder schwächer ausfallen lassen
–> bei heterogenen Primäreffektgrößen
9 Schritte der Metaanalyse (Döring, 2023)
(1) Formulierung der Forschungsfrage der Metaanalyse
- Definition der Fragestellung und Festlegung transparenter Kriterien zur Auswahl der Studien
(2) Such nach inhaltlich einschlägigen Primärstudien
(3) Auswahl und Kodierung der methodisch geeigneten Primärstudien
- systematische Extraktion der nötigen Information aus den Studien; explizite Angabe und Definition der Kriterien & Vergleichsdimensionen; intersubjektiv nachvollziehbare Kodierung von Studien & Moderatorvariablen
(4) Wahl des metaanalystischen Modells
(5) Berechnung einheitlicher Effektgrößenmaße für alle Primärstudien
(6) Berechnung & Signifikanzprüfung des Gesamteffekts
- intersubjektiv nachvollziehbare Gewichtung & statistische Analyse der Studienergebnisse
(7) Prüfung der Homogenität der einzelnen Effektgrößen der Primärstudien
(8) Moderator-/Subgruppenanalyse bei Heterogenität der Effektgrößen
(9) Ergebnisinterpretation und -präsentation der Metananalyse
Homogene und heterogene Effektgrößen
Effektgröße = statistische Kennzahl für Größe und Richtung eines empirischen Effekts (z.B., Mittelwertsdifferenz, Gruppenunterschied, Korrelation etc.)
Homogene Effektgrößen: alle Effekte sind in etwa gleich groß und gleichgerichtet
Heterogene Effektgrößen: einige Effekte fallen größer/kleiner aus und/oder gehen in untersch. Richtungen
–> bei heterogenen Effektgrößen: Überprüfung auf Moderatorvariable(n)
Warum zählt man bei der Metaanalyse nicht einfach die Anzahl der signifikanten und nicht-signifikanten Ergebnisse?
Warum aggregiert man nicht einfach die p-Werte?
Die Signifikanz (p-Wert) ist abhängig von Effektgröße und Stichprobenumfang. Ein nicht-signifikantes Ergebnis bedeutet nicht, dass es keinen Effekt gibt. –> keine b-Fehlerkontrolle
Es interessiert die Größe des Effekts und nicht die (Nicht-)Existenz eines beliebig großen Effekts. Außerdem können gleiche Effektgrößen untersch. p-Werte und gleiche p-Werte untersch. Effektgrößen aufweisen. Es besteht auch ein negativer Zusammenhang zwischen p-Wert und Effektgröße. (Auf der Interpretationsebene: Ein größerer Effekt (besser), ist mit einem höheren p-Wert (schlechter) assoziiert.)
Typische grafische Formen der Ergebnisdarstellung in Metaanalysen
- Flowchart (Ablaufdiagramm)
- Forest-Plot (Effektstärke (y) der einzelnen Studien (x) inklusive Konfidenzintervall und allg. common-effects model & random-effects model)
- Bubble-Plot mit kategorialem/kontinuierlichem Moderator (x-Moderator; y-Effektgröße)
- Funnel-Plot (x-Effektgröße; y-Precision)
Literaturrecherche - Ausgangspunkt, Kriterien, Ziel
Ausgangspunkt: Problemstellung/Fragestellung der Metaanalyse
Kriterien:
Inhaltlich: ergeben sich aus Fragestellung
Methodisch: ergeben auch aus Anforderungen an Qualität der Studien (z.B., randomisierte Zuweisung)
Ziel: Finden aller relevanten Studien, die die Kriterien erfüllen
–> Ist die gefundene Stichprobe repräsentativ? (bei Untersuchung von Teilgruppen, müssen Moderatoren schon im Voraus bekannt sein)
–> Mögliche Beschränkung? (z.B., nur Studien, die nach der letzten Metaanalyse publiziert wurden)
–> Umfang/Breite der untersuchten Studienpopulation beeinflusst Interpretierbarkeit der Ergebnisse
Quellen (Vorgehen) bei der Literaturrecherche
- Stichwortrecherche in elektronischen Datenbanken
- Referenzen in Reviews
- Referenzen in einzelnen Studien
- Einschlägige Fachzeitschriften
- Programme und Abstractbände von Tagungen und Konferenzen
- Kontaktieren von Autor*innen einschlägiger Studien (z.B., (noch) unveröffentlichte Datensätze)
- Forschungsorganisationen
Publikationsbias in der Literaturrecherche für die Metaanalyse
= statistisch verzerrte Darstellung der Datenlage in wissenschaftlichen Zeitschriften infolge einer bevorzugten Veröffentlichung von Studien mit positiven Befunden/signifikanten Ergebnissen
- größere Stichproben liefern präzisere Schätzungen (kleinere Standardfehler) & kleinere Stichproben liefern (trotz vorhandenem Effekt) manchmal nicht signifikante Ergebnisse, die dann nicht veröffentlich werden
–> Verzerrung metaanalytischer Ergebnisse (die Ergebnisse der Studien mit kleineren Stichproben würden die Effektgröße verringern)
Datenextraktion und (Moderator-)Kodierung
+ methodische Aspekte
Datenextraktion = Auswahl der Primärstudien & Berechnung der Effektgrößen
Kodierung = Anwendung eines Kodierschemas zur Einteilung der Primärstudien
–> standardisierter Fragebogen mit geschlossenen Fragen (“an die Studie”)
Methodische Aspekte:
- sorgfältige Entwicklung des Kodierschemas
- Training der Kodierer
- Bestimmung von Vollständigkeit, Reliabilität und Validität der Kodierung
Kriterien für die Wahl eines Effektgrößenmaßes & Konvertierung versch. Effektgrößenmaße
Kriterien:
- Effektgrößenmaß soll aus den Angaben der meisten Studien ermittelbar sein (keine Reanalysen) –> z.B., Cohens d, da Mittelwert und Standardabweichung stets berichtet werden
- Effektgrößenmaß soll inhaltlich interpretierbar sein bzw. für alle Forschenden in diesem Gebiet direkt verständlich sein
Konvertierung: versch. Effektgrößenmaße können ineinander überführt werden (z.B., Cohens d in Cohens f oder r)
Maße der Effektgröße für Mittelwertunterschiede
D=X(mittel)1-X(mittel)2
- unstandardisierte Mittelwertsdifferenz (Vergleich von zwei Mittelwerten in Einheiten der Rohdaten)
- sinnvoll, wenn: alle Studien dieselbe AV/Skala verwenden; die Skala selbst bedeutungsvoll ist; die Skala inhaltlich interpretiert werden kann
Cohens d = (X(mittel)1-X(mittel)2) / S
- standardisierte Mittelwertdifferenz (Vergleich von zwei Mittelwerten in Standardabweichungseinheiten)
- sinnvoll, wenn: verschiedene AVs/Skalen verglichen werden
- Vorteil: Interpretierbarkeit in SD-Einheiten (unabhängig von Skala)
- Problem: Tendenz, die wahre Effektgröße in der Population zu überschätzen
- Korrektur: Hedges’ g
Stichprobenumfang, Standardfehler
Stichprobenumfang = N = Anzahl der ausgewählten Untersuchungsobjekte in einer Primärstudie
Standardfehler = SE = Sigma(Xmittel) = Sigma(X)/Wurzel aus N = SD der Stichprobenkennwerteverteilung