L3 Grundprincipper for inferens Flashcards
Hvad er en standardfejl?
Std. error er udtryk for den typiske afvigelse i et estimats stikprøvemålsfordeling.
Ved unbiased og konsistente estimatorer: den typiske afvigelse fra det sande populationsværdi eller den typiske afstand mellem estimatet og den sande populationsværdi (pga. LLN og CLT)
- hvor langt ligger vi fra den ‘sande’ estimator
- hvor meget vil estimatoren variere på tværs af stikprøver
Typisk mindre end population og stikprøve standardafvigelse (gennemsnit af gennemsnit = ingen outliers).
Hvad er en standardafvigelse?
Et mål for spredningen i en variable eller “den typiske afstand til gennemsnittet”.
Std. afvigelsen er kvadratroden af variansen (2. moment).
Måles i samme enhed som y
I stikprøve: s
I population: sigma
Hvad er en stikprøvemålsfordeling?
Et udtryk for, hvordan et estimatet varierer på tværs af stikprøver (gennemsnittet af gennemsnit-tene). Hvordan vil fordelingen af estimatet se ud for et uendeligt antal stikprøver? (tankeeksperi-ment)
- n –> uendelig approximativ normalfordelt (standardisering)
- n > 30 god approximation
Hvis estimatoren er unbiased og konsistent, da vil gennemsnittet af estimatoren være den sande estimator (n –> uendelig).
Har en standardafvigelse = standardfejl.
Hvad er forskellen på stikprøve standardafvigelsen og populations standardafvigelsen?
Sigma og ‘s’. Hvor sigma er den ‘sande’, men ukendte std. afvigelse og S estimatet i stikprøven af std. afvigelsen.
Hvad bruges standard fejlen til?
Udregning af p-værdi og konfidensintervaller. Evt. formler.
Hvad er en t-værdi?
Antal standardfejl, som hældningskoefficenten eller forskel i gennemsnit ligger fra 0 i t-fordelingen. (ved nulhypotesen)
Hvad er forskellen på en standardfejl og standardafvigelse?
Standardfejlen er stikprøveMÅLsfordelings SD, mens standardafvigelse kan relatere sig til stikprøvefordelingen eller populationen.
Hvorfor er CLT genial?
Når forudsætningerne for CLT er opfyldte (n>30), da er stikprøvemålsfordelingen normalfordelt (juhu ift. inferens).
Hvad siger de store tals lov?
For n –> uendelig
Stikprøvefordeling og ystreg –> populationsfordeling og my
Hvad kan variere størrelsen på standardfejlen?
Størrelsen for stikprøve og standardafvigelsen i stikprøven
FORMEL: SDstikprøve / kvrod N
Hvad er en t-test?
Hypotesetest m. brug af t-fordeling (fortrukne i politologi, da vi ikke kender fordelingen i population).
Nulhypotese: ingen forskel m. grupper + estimator = 0
Brug af t-score –> p-værdi
Hvad er forskellen mellem t-værdi og z-værdi?
Begge bruges til at udregne p-værdier (fortæller hvor mange std. fejl dit estimat er fra nulhypotesen).
P-værdien for t-værdier vil typisk være større (mere sandsynlighed i halen). Men for stikprøve –> uendelig, så vil de give samme p-værdi.
Hvad er normalfordeling vs. std. normalfordeling?
De er begge klokkeformet!
Normalfordeling
- gennemsnit: ystreg
- std. = s
- skævhed = 0 (symmetrisk)
- kurtosis = 3
Std. normalfordeling
- gennemsnit: 0
- std: 1
Enhver normalfordelingen kan standardiseres til std. normalfordelingen:
(yi-ystreg)/SD
Std. normalfordelingen har sin egen sandsynlighedsfordeling: z-fordeling (med kendte sandsynligheder).
T-fordelingen, hvad er det for noget?
Har tykkere “haler” end z-fordelingen - tager højde for usikkerhed ved mindre stikprøver.
Afhænger af antallet af frihedsgarder (n-1) –> jo flere frihedsgrader, jo fladere haler
Mere fleksibel fordeling end z-fordeling
Hvad er en stokastisk variabel?
Stokastisk betyder tilfældighed. En stokastisk variabel bestemmes af en grad tilfældighed, men du kan stadig beregne sandsynligheder.
1) tilfældighed i udvælgelse
2) tilfældighed i svar (reliabilitet)
Det giver usikkerhed. Inferentiel statistik giver et mål for den usikkerhed. Gælder altid, også selvom vi trækker fra populationen.