L4 Gennemsnittet Flashcards

1
Q

Hvornår er observationer ikke uafhængige aka ikke i.i.d (altså afhængige)?

A

Hvis:

  • systematisk udvælgelse (sampling bias)
  • systematisk frafald (non-response bias)
  • tre i samme klasse; deres opfattelse af historie afhænger af deres historielærer
  • paneldata (jeg afhænger af mig selv)

Stort n er ikke garant for uafhængige observationer. En stikprøve hvor stikprøvestørrelsen er tæt på populationsstørrelsen er ikke en garant for ekstern validitet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er formlen for standardfejlen SE for gennemsnittet?

A

SE = SD/kvadrat n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er en god estimator?

A

Middelret/unbiased: Rammer populationsparamenteren i gentagne stikprøver

Efficient: Så lille en varians/standardafvifelse rundt om populationsgennemsnittet som muligt! Ved en lille varians vil vi i de fleste tilfælde ramme et gennemsnit tæt på populationsgennemsnittet

Konsistent: giver konsistente bud på populationsparamenteren (stort N er godt)

Under antagelserne: stort N og i.d.d. (simpel tilfældig udvælgelse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad betyder det, at ystreg er BLUE?

A

Ystreg er ‘best linear unbiased estimator’ på my. Ystreg er således middelret, efficient og konsistent hvis;

  • n>30
  • i.i.d
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er et konfidensinterval?

A

“Vi kan være 95% konfidente på at “det sande estimat” ligger i konfidensintervallet”

Baseres på t-fordelingen i stata!!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad ændrer størrelsen på et konfidensinterval?

A

Konfidensniveauet
- jo større sikkerhed, des bredere interval

Standardfejlen SE

  • jo mindre SE, des mindre interval (stikprøvemålsfordelingen er mere spids)
  • og dermed indirekte n samt var(x)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad sker der når man går fra et 95% konfidensinterval til et 99% konfidensinterval?

A

Konfidensintervallet bliver bredere - vi kan udtale os med større sikkerhed og intervallet må derfor indeholde flere værdier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Er udsagnet sandt eller falsk?

Med 95% sandsynlighed indeholder konfidensintervallet den sande parameter værdi.

A

FALSK! Det er med 95% sikkerhed.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvordan afrunder man et konfidensinterval?

A

Konservativ afrunding! Man runder ned ved det første tal og runder op ved det sidste!

OBS: stata afrunder ikke konservativt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er formlen for beregning af konfidensintervaller?

A

CI = ystreg +/- (t df;alpha/2 * SE)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Nulhypotese vs. alternativ hypotese

A

Nulhypotese: den hypotese vi undlader at forkaste eller forkaster!

Alternativhypotese: det vi accepterer, hvis vi forkaster nulhypotesen (en-sidet / to-sidet)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvilke seks trin er der i fremgangsmåden for hypotesetest (hvad indebærer statistisk hypotesetest)?

A

1) Vurdering af antagelser (n>30 + i.i.d)
2) Opstilling af hypotese (nulhypotese + alternativ)
3) Valgt af TS (t-test: (ystreg-my)/SE(ystreg)
4) Valg kritisk værdi/p-værdi (5 % = 0,05, sandsynligheden for at få den givne værdi, eller noget mere ekstremt)
5) Data og statistik (p-værdien er sandsynligheden for at observere TS eller noget mere ekstremet givet af H0 er sand).
6) Beslutning/konklusen (forkast/undlad at forkaste)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad er en ensidet hypotesetest? Hvordan er den forskellig fra en tosidet?

A

En ensidet hypotesetest er en test af hypotese, hvor man enten accepterer, at værdien er større ELLER mindre end angivet i nulhypotesen (der er en retning).

Ved en tosidet test accepterer man blot, at værdien ikke er, hvad der er angivet i nulhypotesen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er en p-værdi?

A

En p-værdi er sandsynligheden for at trække stikprøvens estimat, eller noget mere ekstremt, givet H0 er sand.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er en estimator?

A

En estimator er et bud på den sande parameter i populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad er standardfejlen et estimat af?

A

Standardfejlen er et estimatet af den typiske afvigelse i stikprøvemålsfordelingen.

17
Q

Baseret på 1.467 svar i en repræsentativ rundspørge blandt amerikanere i 2015 er 95 procent konfidensintervallet for det gennemsnitlige antal nære venner lig [6,8; 8,0]. Er udsagnet korrekt?

Hvis tilfældigt udvalgte stikprøver med 1.467 svar blev udtaget rigtig mange gange, så ville Ῡ i 95% af gangene ligge mellem 6,8 og 8,0

A

FORKERT

Nope. Hvis y-streg eksempelvis ligger i en af halerne, så vil en stor del af de følgende y-streg’ere falde uden for intervallet. Havde vi konstrueret et interval omkring den sande populationsværdi, så havde 95% af y-streg ligget i intervallet (da stikprøvemålsfordelingen er normalfordelt).

18
Q

Baseret på 1.467 svar i en repræsentativ rundspørge blandt amerikanere i 2015 er 95 procent konfidensintervallet for det gennemsnitlige antal nære venner lig [6,8; 8,0]

Sandt eller falsk: Vi kan være 95% konfidente, at μ ligger mellem 6,8 og 8,0.

A

JA! Der er en 95% sikkerhed for at den korrekte μ ligger inden for dette interval, men en 5% sandsynlighed for at den ikke ligger her

19
Q

Baseret på 1.467 svar i en repræsentativ rundspørge blandt amerikanere i 2015 er 95 procent konfidensintervallet for det gennemsnitlige antal nære venner lig [6,8; 8,0]. Er udsagnet korrekt?

Hvis tilfældigt udvalgte stikprøver med 1.467 svar blev udtaget rigtig mange gange, så ville 95% af konfidensintervallerne indeholde m.

A

RIGTIGT

Kims formulering på slide: “Hvis vi trækker uendeligt mange stikprøver og udregner et 95% konfidensinterval, så vil μ være indeholdt i 95% af intervallerne”
Altså: i 95% af tilfældene, er μ inkluderet i konfidensintervallet.

20
Q

Baseret på 1.467 svar i en repræsentativ rundspørge blandt amerikanere i 2015 er 95 procent konfidensintervallet for det gennemsnitlige antal nære venner lig [6,8; 8,0]

Sandt eller falsk: 95% af værdierne for Y (= antal nære venner) ligger for denne rundspørge mellem 6,8 og 8,0.

A

NEJ! Spørgsmålet omhandler ikke gennemsnit, men i stedet hvilken værdi de enkelte observationer tager