Inferens i teori og praksis Flashcards

1
Q

Hvad handler statistisk inferens om?

A

Det handler om, hvor sikre vi kan vide os på de estimater vi får ud af fx regressioner: har vi ramt rigtigt?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvorfor kan der være fejl i vores estimationer selv ved randomiserede eksperimenter?

A

Der vil altid være risiko for tilfældige fejl - fx at man tilfældigt kommer til at tildele treatment til nogle bestemte personer.

Det afhænger af randomiseringen err lykkedes (om stikprøvestørrelsen har været stor nok)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Tre typiske estimations-problemer

A
  1. At stikprøven ikke er repræsentativ for populationen
  2. At randomiseringen ikke lykkes
  3. Naturlig fordeling i populationsdata
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Tre krav til vores estimatorer

A
  1. Unbiased
  2. Konsistent
  3. Efficiens/præcision (varians)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad vil det sige, at en estimator er unbiased?

A

Grundlæggende: Gennemsnitligt for vi ret - hvis man gør noget nok gange (fx trækker en stikprøve eller randomiserer), så rammer man rigtigt, selvom der er fejl på tværs af enkelte stikprøver eller randomiseringer. Det vil udligne hinanden gennemsnitligt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad vil det sige, at en estimator er konsistent?

A

Forskellen mellem dit estimat og den sande værdi, skal nærme sig 0, når dine observationer går mod uendelig. Dvs. jo flere observationer, jo tættere kommer man på den sande effekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad vil det sige, at en estimator er efficient/præcis?

A

Efficiens: Hvor langt væk er mit estimat fra den rigtige værdi i en given sammenhæng (fx en given sample eller randomisering)?

Vi vil have efficiensen til at være så høj som muligt, sådan at vore estimat er tæt på den rigtige værdi. Det måler vi ved at kigge på variansen af estimatoren: standardfejlen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er bias/varians trade-off’et?

A

Man kan estimere på mange måder, og der er et trade-off mellem bias og varians alt efter hvad man vælger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad påvirker variansen i et estimat?

A

Variansen i vores estimat siger noget om, hvor tæt vores estimater er på den rigtige værd (altså præcisionen af estimaterne)

Variansen i estimatet er defineret af to ting:

  • Variansen i grupperne ift. outcome: jo mindre variation (mere homogene grupper) → jo mere præcision
  • Antallet af observationer: jo flere observationer → jo mindre varians → jo mere præcision
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er signifikansniveau?

A

Signifikansniveau: Sandsynligheden for at undgå type 1 fejl = signifikansniveauet.

Dvs. hvis vores signifikansniveau er er 0,05, så er sandsynligheden for at lave en type 1 fejl 5%. Dvs. vi tager fejl i 5% af tilfældene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

P-værdi

A

P-værdi: Sandsynligheden for at observere noget mere ekstremt end det vi har observeret, hvis vores nulhypotese var sand.

Hvor sandsynligt er det at se vores estimat (fx 2.5), hvis der egentlig ikke var nogen effekt?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Konfidensinterval

A

Et interval der 95% af gangene vi trækker en random sample vil indeholde vores koefficient.

Hvis konfidensintervallet overlapper med 0, så vil P-værdien være insignifikant. Så de to ting hænger sammen.

Bredden af estimatet afhænger af mange ting, det vil blive smallere ved en stor stikprøve → så jo større stikprøve jo mere præcist et interval kan vi få.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Standardfejl

A

Standardfejl= Standardafvigelsen af stikprøvefordelingen for estimatoren → dvs. variansen af vores estimator

Standardfejlen er ikke standardfejlen for estimatet (effekten), men for selve estimatoren (måden vi gør det på).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Standardfejlen i OLS-estimatoren

A

Standardfejlen i OLS-estimatoren er kvadratroden af variansen i estimatoren.

Den her estimator antager homoskeda (at variansen i kontrol- og treatmentgruppen er den samme - at variansen er uafhængig af X). Dvs. at de to gruppers residualer udligner hinanden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvorfor kan det forbedre ens estimater at inkludere kontrolvariable?

A

Det reducerer variansen i ens estimat, når man inddrager en kovariat, der er urelateret til X men som påvirker Y.

Det er godt at tage dem med, da det mindsker variansen i gruppernes residualer ift. Y, så det reducerer variansen (og standardfejlen), hvilket øger efficiensen af estimaterne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvornår skal man bruge robuste standardfejl?

A

Når man ikke kan antage homoskeda (at variansen i kontrol- og treatmentgruppen er den samme - at variansen er uafhængig af X)

17
Q

Exact inferens

A

En type inferens, der bygger på stærke antagelser omkring distributionen af vores koefficient/estimat → fx antager normalfordeling

18
Q

Asymtopisk inferens

A

En type inferens, der bygger på CLT (central limit theorem) → når N går mod uendelig, så bliver distributionen af vores koefficient/estimat være normalfordelt omkring den sande værdi.

Dvs. denne tilgang kræver et stort N.
Men den kræver til gengæld ingen strenge antagelser om fordelingen af variable (som exact inferens).

Den type vi har anvendt i metode-undervisningen.

19
Q

Randomiserings inferens

A

En type inferens, der bygger på antagelser omkring tildelingen af treatment.

Kan kun bruges i eksperimenter eller naturlige eksperimenter.

I stedet for at bruge antagelser om sample størrelse (N mod uendelig som i asymptotisk) eller variabel-distributioner (som i exact), så prøver den at estimere præcist hvordan distributionen ser ud i det konkrete tilfælde.