prov. Fragenkatalog 91 - 105 Flashcards

1
Q
  1. Was ist eine Poweranalyse? Welche Macht wird üblicherweise angestrebt?
A

Eine Poweranalyse ist die Berechnung der (statistischen) Macht für ein gegebenes Design und Effektgröße D. Die
Macht bezeichnet die Wahrscheinlichkeit, eine Nullhypothese zu verwerfen, wenn sie falsch ist (hängt
u.a. von n ab, von der Größe des Effekts D und dem gewünschten Signifikanzniveau α). Die Analyse wird
meist verwendet, um die benötigte Fallzahl zum Erreichen der gewünschten Macht auszurechnen. Die
Berechnung der Macht zu einem festen Design kann nach einem nicht signifikanten Resultat wichtig
sein – welche Chance hätte dieses Design denn überhaupt gehabt? (Wenn kaum eine Chance, sagt das
nicht signifikante Resultat ja kaum etwas aus)
Meist wird eine Testmacht von 80% angestrebt (d.h. wenn die Effektgröße wie vorhergesagt ist, dann
beträgt für die errechnete Stichprobengröße die Wahrscheinlichkeit für ein signifikantes Ergebnis 80%.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q
  1. Was sind Effektgrößen? Wofür sind sie nützlich?
A

„Effektgröße“ ist auch ein standardisierter Begriff. Effektgrößen werden verwendet, um Resultate über
verschiedene Studien vergleichen zu können (natürlich auch wichtig für Metaanalysen). Es handelt sich
also um ein allgemein verwendbares Maß -> unterschiedliche Skalen und Designs können miteinander
verglichen werden. Effektgrößen beschreiben, wie groß der Zusammenhang zwischen den Variablen ist
bzw. wie groß ein Effekt ist.
Es sind unterschiedliche Maße der Effektstärke in Gebrauch. Nach Cohen sollte für eine Maßzahl der
Effektstärke gelten:

  • Sie ist eine dimensionslose Zahl
  • Sie hängt nicht von der Maßeinheit der Ursprungsdaten ab
  • Sie ist, im Gegensatz zu Teststatistiken, unabhängig von der Stichprobengröße
  • Ihr Wert sollte nahe bei 0 liegen, wenn die Nullhypothese des zugehörigen Tests nicht abgelehnt
    wurde.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  1. Welche Effektgrößen würden Sie als groß, mittel bzw. klein betrachten, und welche Konsequenz haben entsprechende Erwartungen für die Fallzahlplanung?
A

Es gibt Konventionen, was als groß, mittel oder klein bezeichnet werden soll.
Für Cohen’s d gilt:

  • 0.2 klein
  • 0.5 mittel
  • 0.8 groß

Dabei heißt 0.8 im Prinzip: 0.8 Standardabweichungen Unterschied.

Für die Pearson Produkt-Moment-Korrelation gilt:

  • 0.1 klein
  • 0.3 mittel
  • 0.5 groß (obwohl 0.5 eigentlich nur 25% erklärter Varianz entspricht)

Je nach Effektgröße muss die Stichprobe entsprechend groß angelegt werden. Bücher bieten dazu Tabellen
an – Beispiele:
• Cohen’s d:

  • klein -> n=310
  • mittel -> n=50
  • groß -> n=20

• Pearson Produkt-Moment-Korrelation:

  • klein -> n=618
  • mittel -> n=68
  • groß -> n=22

Es lässt sich also allgemein sagen: je größer der erwartete Effekt, desto kleiner die benötigte Stichprobe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  1. Wie sind Prävalenz und Rücklauf in einer Fallzahlplanung zu berücksichtigen?
A

Prävalenz ist der Prozentsatz der Zielgruppe im sample (z.B. wie viele meiner angeschriebenen Personen
haben Kinder oder konsumieren eine bestimmte Produktgruppe).
Rücklauf ist der Prozentsatz innerhalb der angeschriebenen Zielgruppe, der dann auch wirklich Daten
liefert.

Die Endgültige Stichprobengröße setzt sich dann also zusammen aus:
Anzahl kontaktierter Personen × Prävalenzrate × Rücklaufquote.
Insofern ist die Stichprobe so zu planen, dass sich je nach erwarteter Prävalenz und Rücklauf am Ende
die gewünschte Anzahl von Personen ausgeht, die auch wirklich Daten liefern.
Illustrationsbeispiel:

  • angestrebtes n = 400
  • Prävalenz = 95%
  • erwarteter Rücklauf = 40%
  • -> 400/(0.95*0.4) = 1050 Personen sind zu kontaktieren.

Der Rücklauf muss also unbedingt dokumentiert werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  1. V: Sie schätzen, dass etwa 20% der befragten Mädchen Missbrauchserfahrung aufweisen, und dass nur etwa 10% der Kontaktierten bereit sind, sich von Ihnen befragen zu lassen. Wieviele Personen wären demnach zu kontaktieren, wenn Sie auf eine Stichprobe von 100 auswertbaren Fällen kommen möchten? (gesuchte Zahl: n=5000)
A

Angestrebtes n = 100
Prävalenz = 0.20
erwarteter Rücklauf = 0.10
-> 100/(0.2*0.1) = 5000 Personen sollten kontaktiert werden, um eine Stichprobe von 100 auswertbaren Fällen zu bekommen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
  1. V: Ihr(e) AuftraggeberIn sieht Ihre Fallzahlplanung und meint, dass statt einer Genauigkeit von 5% eine von 1% erreicht werden soll. Was antworten Sie, um wieviel dadurch die Stichprobengröße ansteigen wird? (gesuchte Zahl: 25)
A

Man braucht k2 mal die Stichprobe, um den Fehler um einen Faktor k kleiner zu machen.
k = 5/1 = 5
-> 52 = 25 -> Die Stichprobe muss 25x größer sein, um eine Genauigkeit von 1% zu bekommen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  1. V: Es wird ein sehr knappes Ergebnis bei einer Volksabstimmung erwartet. Eine Umfrage mit n=400 Personen prognostiziert eine Zustimmung von 51%. Lässt sich das Ergebnis daraus vorhersagen? Was würden Sie aus dem Stand (ohne Rechnung) vermuten? Was sagt eine genaue Rechnung? ([0.46;0.56])
A

Bei einer Zustimmung von 50% würden wir den konservativsten Wert für die Präzision der Schätzung
erwarten – d.h. die Schätzung wäre eher weniger präzise (das Konfidenzintervall wäre entsprechend
breit). Insofern würde ich bei einer Zustimmung von 51% mit einer recht ungenauen Schätzung rechnen
und es wäre gut denkbar, dass er tatsächliche Wert unter 50% fällt -> Das Ergebnis lässt sich also nicht
zuverlässig aus der Angabe vorhersagen.

BILD mit genauer Rechnung

Wie bereits vermutet liegen laut Konfidenzintervall mögliche Werte sowohl unterhalb der (vermutlich
angestrebten) 50% Linie, als auch darüber à [0.46; 0.56]. Mit 95%iger Konfidenz liegt der wahre Wert
zwischen 46% und 56%, das Ergebnis lässt sich also aufgrund der Daten noch nicht vorhersagen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
  1. V: Bei einer postalischen Befragung über Elternschaft rechnen Sie damit, dass 70% der Angeschriebenen tatsächlich Eltern sind, und dass von diesen etwa 20% antworten werden. Wieviele Personen müssen Sie anschreiben, um eine Nettostichprobe von n=500 erwarten zu dürfen? (3572)
A

Angestrebtes n = 500
Prävalenz = 0.7
erwarteter Rücklauf = 0.2
->500/(0.7*0.2) = 3571.4286 ≈ 3572 Personen müssen angeschrieben werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q
  1. V: Sie möchten signifikanzstatistisch untersuchen, ob Psychologiestudierende sich in ihren ethischen Ansichten von Wirtschaftsstudierenden unterscheiden. Was müssten Sie bei einer Fallzahlplanung berücksichtigen? Was für eine Fallzahl könnte Ihrer Einschätzung nach resultieren?
A

Die Fallzahlplanung hängt von der erwarteten Effektgröße, dem α-Niveau und der gewünschten
Präzision ab
.
Angenommen, der Effekt ist maximal mittelgroß, so müssten nach den Richtwerten aus Büchern
mindestens 50 Psychologie- und 50 Wirtschaftstudierende in die Untersuchung einbezogen werden (bei
einem kleinen Effekt wären es 310, bei einem großen nur 20 pro Gruppe).
Außerdem muss die Normalverteilung berücksichtigt werden, um Rückschlüsse auf die
Grundgesamtheit ziehen zu können (d.h. die Stichprobe muss normalverteilt sein und das dafür muss das
n entsprechend groß sein).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q
  1. V: In einer Gemeinderatswahl liegt der Anteil der Wählerschaft einer Bürgermeister-kandidatin bei 52% nach Auszählung von 900 Stimmen. Darf sie schon jubeln? Ändert sich das Resultat, wenn man weiß, dass insgesamt 1000 Stimmen abgegeben wurden? (Unschärfe 3.3% ohne, 1% mit Endlichkeitskorrektur)
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  1. Was besagt die Endlichkeitskorrektur?
A

Wenn man mit der Stichprobe die Population zu einem merklichen Prozentsatz erfasst, so sinkt dadurch
die Messungenauigkeit. Erfassen wird die Population komplett, so sinkt der Messfehler auf 0
Durch die Endlichkeitskorrektur sinkt die Messfehlervarianz um einen Faktor (1 – Auswahlsatz). Der
Standardfehler sinkt um √(𝟏 − 𝑷𝒓𝒐𝒑𝒐𝒓𝒕𝒊𝒐𝒏) . Sinken bedeutet hier, dass der SE mit dem Faktor
multipliziert wird.
Wenn man tatsächlich einen erheblichen Teil der Population erheben kann, so kann die Messungenauigkeit
erheblich abnehmen (z.B. wenn wir 84% der Population erheben, so sinkt der Standardfehler um
√(1 − 0.84) = √0.16 = 0.40 -> der nach der üblichen Formel berechnete Fehler ist mit dieser Korrektur zu
multiplizieren).
In der Psychologie können wir in der Regel nur einen sehr kleinen Prozentanteil der uns
interessierenden Zielpopulation erheben -> die Endlichkeitskorrektur geht gegen 1 (z.B. 0.003%
erhoben -> √1 − 0.00003 = 0.999985 ≈ 1; ist also irrelevant, weil x*1 = x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q
  1. V: Wenn Sie von einer Population 50% erhoben haben, um welchen Faktor präzisiert sich dadurch die Messgenauigkeit? (gesuchte Zahl: Standardfehler sinkt um Faktor √(1-0.5)=0.71)
A

Wenn wir eine bestimmte Proportion der Population erheben, so sinkt der Standardfehler (präzisiert
sich die Messgenauigkeit) um √(𝟏 − 𝑷𝒓𝒐𝒑𝒐𝒓𝒕𝒊𝒐𝒏) -> sinken bedeutet hier SE × Faktor.
Hier sinkt der Standardfehler (bzw. präzisiert sich die Messgenauigkeit) um √(1 − 0.5) = 0.71

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
  1. Welche Gründe gibt es dafür, nur Stichproben zu ziehen und keine Vollerhebungen durchzuführen?
A
  • Eine Vollerhebung ist oft zu aufwendig oder zu viel Belastung
  • Mitunter ist eine Population nicht geschlossen (z.B. Mütter)
  • Vielleicht interessiert uns eine Population, die nur teilweise bekannt ist (z.B. Population der Burnoutgefährdeten Menschen)
  • Womöglich könnte eine Population durch die Untersuchung gefährdet oder zerstört werden (z.B. Qualitätskontrollen: Crashtest der gesamten Jahrespopulation eines Automobilherstellers -> alle Autos würden getestet und zerstört werden)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
  1. Was ist Repräsentativität einer Stichprobe, und wie kann man versuchen, sie zu erreichen?
A

Repräsentativität bedeutet, dass die Stichprobe der Population in ihrer Zusammensetzung möglichst
ähnlich ist.

Eine Stichprobe ist dabei (merkmals)spezifisch repräsentativ, wenn ihre Zusammensetzung hinsichtlich
relevanter Merkmale der Populationszusammensetzung entspricht.
Eine Stichprobe ist global repräsentativ, wenn ihre Zusammensetzung in nahezu allen Merkmalen der
Populationszusammensetzung entspricht.
Das wertvollste Tool zur Erreichung repräsentativer Stichproben ist wohl der Zufall.
Zufallsstichproben werden mit hinreichender Größe automatisch repräsentativ, sofern der
Auswahlrahmen repräsentativ ist (ansonsten kommt es zu einem sampling frame error – z.B. ist das Telefonbuch als sampling frame nicht repräsentativ).
Problematisch sind außerdem:

  • Oversampling (eine Gruppe, z.B. weibliche Pensionistinnen über 80, ist überproportional oft vertreten)
  • Undersampling (eine Gruppe ist unterproportional zu den anderen Gruppen vertreten)
  • Non-Response
    • -> dann haben wir nämlich auch mit wachsender Stichprobe nicht notwendigerweise Repräsentativität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
  1. Welche Arten der Stichprobenziehung kennen Sie? (mit jeweils kurzer Erklärung)
A

Grob lässt sich in probabilistische und nicht-probabilistische Stichproben unterscheiden. Eine
probabilistische Stichprobe liegt dann vor, wenn jedes Element der Population mit der gleichen
Wahrscheinlichkeit in die Stichprobe aufgenommen werden kann (oder die Auswahlwahrscheinlichkeiten zumindest bekannt sind). Sind die Auswahlwahrscheinlichkeiten dagegen nicht bekannt, handelt es sich um eine nicht-probabilistische Stichprobe.

  • Probabilistische Stichproben (nur diese erlauben, Populationsparameter mit entsprechender Präzision zu schätzen):
    • Einfache Zufallsstichprobe (simple random sampling)
    • Geschichtete/stratifizierte Stichprobe (stratified sample)
    • Klumpenstichprobe (cluster sampling)
    • Mehrstufige Stichprobe (multi-stage sampling)
    • Systematisches („implizites“) sampling / implizite Schichtung
  • Nicht-probabilistische Stichproben:
    • Ad-hoc-Stichprobe
    • Theoretische Stichprobe
    • Quotenstichprobe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly