Begreber Flashcards
Kausal inferens
Det er studiet af kontrafaktiske udfald: vi vil gerne sige noget om de udfald, der VILLE være sket, hvis tingene var gået anderledes
Kausal effekt
Forskellen mellem en enheds potentielle outcome, hvis vedkommende er treatet, og det potentielle outcome, hvis vedkommende er untreated.
Potentielle outcomes
Hver enhed har to potentielle udfald på den variabel vi kigger på, alt afhængig af, om man er blevet treated eller ej
Selektionsbias
Forskelle i gennemsnittet på Y mellem treatment- og kontrolgruppen selv HVIS ingen var blevet treatet - dvs forskelle i udgangspunktet.
Forskelle mellem treatment og kontrolgruppen i fraværet af treatment
Colliding variabel
En tredjevariabel (Z) der er påvirket af begge vores variable (både den uafhængige og den afhængige).
IKKE kontroller –> post treatment bias
Confounding
En tredjevariabel (Z) der påvirker begge dine variable (både den uafhængige og den afhængige)
KONTROLLER –> minimerer selektionsbias
Statistisk inferens
Hvor sikre er vi på de estimater vi får ud?
Unbiased estimator
Gennemsnitligt rammer vi rigtigt: hvis vi gentager randomiseringen/trækker en ny stikprøve mange gange, så rammer vi gennemsnitligt rigtigt
Konsistent estimator
Når antal observationer går mod uendelig, skal forskellen mellem dit estimat og den sande værdi gå mod 0.
Præcis/efficient estimator
Ens estimat i en given stikprøve skal være tæt på den sande værdi –> kan du sige noget om ved at se på standardfejlen
Signifikansniveau
Sandsynligheden for at undgå type 1 fejl: dvs. tage fejl og sige, at der er en effekt, når der ikke er det
Den tærskel vi har sat for, hvornår vi vil afvise vores nulhypotese –> hvis vores p-værdi er ligmed eller mindre end det signifikansniveau, så afviser vi vores nulhypotese.
P-værdi
Sandsynligheden for at observere noget mere ekstremt end det vi har observeret, hvis vores nulhypotese var sand.
Konfidensinterval
Et interval der 95% af gangene vi trækker en random sample vil indeholde vores koefficient.
Standardfejl
Standardafvigelsen af stikprøvefordelingen for estimatoren → dvs. variansen af vores estimator
Sagt på en anden måde: Usikkerheden ved estimatoren: hvis vi skulle lave eksperimentet/stikprøven igen og igen, hvad ville så være variationen i de estimater vi ville få?
Type 1 fejl
Falsk positiv: Man siger der er en effekt, når der ikke er det
–> stærkt relateret til signifikansniveau