L4 Gennemsnittet Flashcards
Hvornår er observationer ikke uafhængige aka ikke i.i.d (altså afhængige)?
Hvis:
- systematisk udvælgelse (sampling bias)
- systematisk frafald (non-response bias)
- tre i samme klasse; deres opfattelse af historie afhænger af deres historielærer
- paneldata (jeg afhænger af mig selv)
Stort n er ikke garant for uafhængige observationer. En stikprøve hvor stikprøvestørrelsen er tæt på populationsstørrelsen er ikke en garant for ekstern validitet
Hvad er formlen for standardfejlen SE for gennemsnittet?
SE = SD/kvadrat n
Hvad er en god estimator?
Middelret/unbiased: Rammer populationsparamenteren i gentagne stikprøver
Efficient: Så lille en varians/standardafvifelse rundt om populationsgennemsnittet som muligt! Ved en lille varians vil vi i de fleste tilfælde ramme et gennemsnit tæt på populationsgennemsnittet
Konsistent: giver konsistente bud på populationsparamenteren (stort N er godt)
Under antagelserne: stort N og i.d.d. (simpel tilfældig udvælgelse)
Hvad betyder det, at ystreg er BLUE?
Ystreg er ‘best linear unbiased estimator’ på my. Ystreg er således middelret, efficient og konsistent hvis;
- n>30
- i.i.d
Hvad er et konfidensinterval?
“Vi kan være 95% konfidente på at “det sande estimat” ligger i konfidensintervallet”
Baseres på t-fordelingen i stata!!
Hvad ændrer størrelsen på et konfidensinterval?
Konfidensniveauet
- jo større sikkerhed, des bredere interval
Standardfejlen SE
- jo mindre SE, des mindre interval (stikprøvemålsfordelingen er mere spids)
- og dermed indirekte n samt var(x)
Hvad sker der når man går fra et 95% konfidensinterval til et 99% konfidensinterval?
Konfidensintervallet bliver bredere - vi kan udtale os med større sikkerhed og intervallet må derfor indeholde flere værdier
Er udsagnet sandt eller falsk?
Med 95% sandsynlighed indeholder konfidensintervallet den sande parameter værdi.
FALSK! Det er med 95% sikkerhed.
Hvordan afrunder man et konfidensinterval?
Konservativ afrunding! Man runder ned ved det første tal og runder op ved det sidste!
OBS: stata afrunder ikke konservativt
Hvad er formlen for beregning af konfidensintervaller?
CI = ystreg +/- (t df;alpha/2 * SE)
Nulhypotese vs. alternativ hypotese
Nulhypotese: den hypotese vi undlader at forkaste eller forkaster!
Alternativhypotese: det vi accepterer, hvis vi forkaster nulhypotesen (en-sidet / to-sidet)
Hvilke seks trin er der i fremgangsmåden for hypotesetest (hvad indebærer statistisk hypotesetest)?
1) Vurdering af antagelser (n>30 + i.i.d)
2) Opstilling af hypotese (nulhypotese + alternativ)
3) Valgt af TS (t-test: (ystreg-my)/SE(ystreg)
4) Valg kritisk værdi/p-værdi (5 % = 0,05, sandsynligheden for at få den givne værdi, eller noget mere ekstremt)
5) Data og statistik (p-værdien er sandsynligheden for at observere TS eller noget mere ekstremet givet af H0 er sand).
6) Beslutning/konklusen (forkast/undlad at forkaste)
Hvad er en ensidet hypotesetest? Hvordan er den forskellig fra en tosidet?
En ensidet hypotesetest er en test af hypotese, hvor man enten accepterer, at værdien er større ELLER mindre end angivet i nulhypotesen (der er en retning).
Ved en tosidet test accepterer man blot, at værdien ikke er, hvad der er angivet i nulhypotesen
Hvad er en p-værdi?
En p-værdi er sandsynligheden for at trække stikprøvens estimat, eller noget mere ekstremt, givet H0 er sand.
Hvad er en estimator?
En estimator er et bud på den sande parameter i populationen.