Propensity Score Matching Flashcards
Sechs Schritte
1) Bestimmung der Ähnlichkeiten
2) Bestimmung der potentiellen Matching- Partner
3) Bestimmung der Matching-Partner
4) Diskussion der Annahmen
5) Beurteilung der Güte des Matching
6) Schätzung des Effekts
Definiere Störvariable
z.B Starpower, Produktionsbudget, Genre, Serie
Definiere Maßnahme
Gewinn eines Oscars
Definiere ergebnisvariable
Kinoumsatz
Bestimmung Ähnlichkeiten Möglichkeiten
Es müssen alle Störvariablen berücksichtigt werden, die Einfluss auf die Teilnahme der Maßnahme ausüben
1) Direktes Matching
2) Propensity Score Matching
Probleme des direkten Matchings
Da beim Matching Partner alle Ausprägungen der Störvariablen identisch sein müsse, wird es mit steigender Anzahl von Störvariablen schwierig, einen Matching Partner zu finden (Dimensionalitätsproblem)
Wie werden Propensity Scores berechnet?
Logisitische Regression
Relevante Matching Alogrithmen
Nearest Neighbour, Caliper (mit und ohne Zurücklegen)
Kernel und Radius
Stable Unit Treatment Value Assumption
Stable Unit Treatment Value Assumption
Teilnahme eines Probanden an der Maßnahme beeinflusst ausschließlich das Verhalten dieser Probanden und hat keinen Einfluss auf das Verhalten dieser Probanden
Strongly Ingnorable Treatment Assignment
besagt, dass nach dem Matching auf die beobachteten Störvariablen die Werte der Ergebnisvariablen nicht durch die Störvariablen beeinflusst werden
Conditional Mean Independence Assumption
CMIA ist ähnlich wie SITA - aber weniger streng und betrachtet nur die Erwartungswerte der Ergebnisvariablen
Voraussetzungen
Stable Unit Treatment Value Assumption
Strongly Ingnorable Treatment Assignment
Conditional Mean Independence Assumption
Was ist der Sample Perzent Reduction in Bias?
Messgröße mit der geprüft werden kann, wie stark sich die Störvariablen von Teilnehmern und Nicht-Teilnehmern nach dem Matching angeglichen haben?
Kritikpunkte Direktes Matching
- Selbstselektionseffekt wird nicht beachtet
- geringe Stichprobe
- Problem: Dimensionalität; bei steigender Anzahl an Störvariablen ist es schwierig einen Matching Partner zu finden
Probleme bei “mit Zurücklegen”
bereits zugeordnetes Match kann nochmal verwendet werden; Problematik: Immer derselbe Matching-Partner, Gruppe der gemachten Partner wird viel kleiner -> Ergebnis instabil
Probleme bei “ohne Zurücklegen”
Matchingpartner werden nach dem Match ausgeschlossen
Matching-Ergebnis (Güte) abhängig von Reihenfolge. Große Distanzen müssen akzeptiert werden
-> evtl. schlechtere Matchingpartner für spätere Kunden
Welche Probleme/Nachteile gibt es beim Propensity Score Matching allgemein
Datenproblematik: sehr großer Datensatz nötig optimaler Common Supportt sicherstellen geeignete Störvariablen müssen vorliegen Statistiksoftware Regression auf Basis des selektionskorrigierten Datensatzes ist nicht mehr vollständig interpretierbar
Was versteht man unter einem Selektionseffekt bei Kritikern?
Generiert eine Kritik mehr Erfolg oder werden erfolgreiche/populäre Bücher eher besprochen?
Es ist nicht zufällig ob ein Buch besprochen wird; es werden meist nur erfolgsversprechende Bücher besprochen
Selbstselktionseffekte können durch Propensity Score Matching berücksichtigt werden