Resampling Verfahren Flashcards
Wie kommt man zur SPV?
- Simulation (Resampling)
- mathematische Ableitung (Formel für SE)
- empirisch (Metaanalyse)
Was ist der SE?
Standardabweichung der SPV
Was besagt das Gesetz der großen Zahlen?
Je größer n, desto mehr nähert sich der Kennwert dem wahren Wert an. (Genauigkeit)
Was besagt der zentrale Grenzwertsatz?
gebräuchliche SPV sind normalverteilt
Was ist die Grundannahme beim Resampling?
SP ist repräsentativ für die Population
wie bei herkömmlicher Inferenzstatistik
Unterschied: Wie man SPV erhält
Wie erhält man die SPV?
- Wiederholtes (zufälliges) Ziehen von Werten aus der SP mit oder ohne Zurücklegen (üblicherweise: nResampling = nOriginal, Ziehungsprozedur hängt vom Verfahren ab)
- Berechnen des gewünschten Kennwertes
- Oftmaliges Wiederholen von 1. und 2. (z.B. 1000 x) –> dann hat man z.B. 1000 MW und daraus entsteht der emp. MW
- Die so entstehende (empirische) SPV ist die Grundlage für Inferenzen (z.B. KI)
Was sind Vorteile des Resampling?
- Keine Annahmen über Populationsverteilungen nötig
- Beliebig komplexe Kennwerte prüfbar
Werte bei konventionellen Signifikanztests oder KIs oft sehr eingeschränkt
Fällt nicht weiter auf, weil man in Psy. oft nur bestimmte Kennwerte nutzt
Welchen Einfluss hat die Anzahl k der Resampling SPs?
lieber mehr, statt weniger SP ziehen –> Unterschied zwischen Resampling SPV und theoretischer wird immer kleiner, je mehr SP gezogen werden (k = 10.000 fast nicht mehr von theor. SPV zu unterscheiden)
Was ist der Einfluss der Größe der SPs?
Resampling SPs sollten genauso groß sein wie die Original SP.
* Breite der Resampling SP ändert sich je nach Resampling SP-Größe
* traditionelle Inferenzstatistik: SE ändert sich mit n –> Größe von SE bestimmt Länge der KI und Power von Signifikanztests
* genauso hier: zieht man kleinere SPs, überschätzt man Länge der KI und Streuung und umgekehrt
Wozu macht man Bootstrapping?
Konstruktion von KIs
Man braucht hier keine Formel, sondern zählt einfach
Wie gehe ich beim Bootstrapping vor?
- Wiederholtes zufälliges Ziehen von Werten aus der SP mit Zurücklegen (kann sein, dass man den Wert mehrmals zieht, so kommt Variation zustande)
- Berechnen des gewünschten Kennwerts
- und 2. oft wdh.
- Entsprechende Perzentile der SPV (z.B. 2,5% und 97,5%) bestimmen –> Enden des KI (z.B. 95% KI)
Wann wendet man einen Randomisierungstest an?
Wie bei konventionellen Testverfahren (Signifikanztest) –> p-Wert
Wir erstellen die SPV für die H0
mit weniger Annahmen und beliebigen Kennwerten
Wie geht man beim Randomisierungstest vor?
- Was besagt die H0?
- Abhängig von der Antwort auf 1: Konstruktion der Resampling-SPV für die H0 mit entsprechendem Kennwert
- Festlegung auf Alpha
- Vergleich von p und a
wenn z.B. Normalverteilungs- und Varianzhomogenitätsannahme verletzt
Randomisierungstest
Was sollte man zur Power wissen?
= Anteil der SPV für H1 jenseits des kritischen Werts
SPV für H1 nicht a priori konstruierbar (Resampling SPV basieren auf empirisch gefundener SP) –> für Powerabschätzung korrespondierenden konventionellen Test benutzen.
Bei großen SP kann ohne Weiteres die Standardnormalverteilung dafür benutzt werden.
Randomisierungstest
Was sollte man zu (empirischen) Effektgrößen wissen?
–> zur Durchführung von Metaanalysen
Können direkt aus den Daten berechnet werden (wenn Annahmen für trad. Tests nicht zutreffen wird man vglw. kleinere Werte bekommen).
Wenn man jedoch komplexere Parameter verwendet (für die keine “klassischen” Effektgrößen existieren) sollte man die direkt interpretieren.
z.B. p-Wert