L3 Grundprincipper for inferens Flashcards

1
Q

Hvad er en standardfejl?

A

Std. error er udtryk for den typiske afvigelse i et estimats stikprøvemålsfordeling.

Ved unbiased og konsistente estimatorer: den typiske afvigelse fra det sande populationsværdi eller den typiske afstand mellem estimatet og den sande populationsværdi (pga. LLN og CLT)

  • hvor langt ligger vi fra den ‘sande’ estimator
  • hvor meget vil estimatoren variere på tværs af stikprøver

Typisk mindre end population og stikprøve standardafvigelse (gennemsnit af gennemsnit = ingen outliers).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er en standardafvigelse?

A

Et mål for spredningen i en variable eller “den typiske afstand til gennemsnittet”.

Std. afvigelsen er kvadratroden af variansen (2. moment).

Måles i samme enhed som y

I stikprøve: s
I population: sigma

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er en stikprøvemålsfordeling?

A

Et udtryk for, hvordan et estimatet varierer på tværs af stikprøver (gennemsnittet af gennemsnit-tene). Hvordan vil fordelingen af estimatet se ud for et uendeligt antal stikprøver? (tankeeksperi-ment)

  • n –> uendelig approximativ normalfordelt (standardisering)
  • n > 30 god approximation

Hvis estimatoren er unbiased og konsistent, da vil gennemsnittet af estimatoren være den sande estimator (n –> uendelig).

Har en standardafvigelse = standardfejl.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er forskellen på stikprøve standardafvigelsen og populations standardafvigelsen?

A

Sigma og ‘s’. Hvor sigma er den ‘sande’, men ukendte std. afvigelse og S estimatet i stikprøven af std. afvigelsen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad bruges standard fejlen til?

A

Udregning af p-værdi og konfidensintervaller. Evt. formler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er en t-værdi?

A

Antal standardfejl, som hældningskoefficenten eller forskel i gennemsnit ligger fra 0 i t-fordelingen. (ved nulhypotesen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er forskellen på en standardfejl og standardafvigelse?

A

Standardfejlen er stikprøveMÅLsfordelings SD, mens standardafvigelse kan relatere sig til stikprøvefordelingen eller populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvorfor er CLT genial?

A

Når forudsætningerne for CLT er opfyldte (n>30), da er stikprøvemålsfordelingen normalfordelt (juhu ift. inferens).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad siger de store tals lov?

A

For n –> uendelig

Stikprøvefordeling og ystreg –> populationsfordeling og my

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad kan variere størrelsen på standardfejlen?

A

Størrelsen for stikprøve og standardafvigelsen i stikprøven

FORMEL: SDstikprøve / kvrod N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad er en t-test?

A

Hypotesetest m. brug af t-fordeling (fortrukne i politologi, da vi ikke kender fordelingen i population).

Nulhypotese: ingen forskel m. grupper + estimator = 0

Brug af t-score –> p-værdi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er forskellen mellem t-værdi og z-værdi?

A

Begge bruges til at udregne p-værdier (fortæller hvor mange std. fejl dit estimat er fra nulhypotesen).

P-værdien for t-værdier vil typisk være større (mere sandsynlighed i halen). Men for stikprøve –> uendelig, så vil de give samme p-værdi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad er normalfordeling vs. std. normalfordeling?

A

De er begge klokkeformet!

Normalfordeling

  • gennemsnit: ystreg
  • std. = s
  • skævhed = 0 (symmetrisk)
  • kurtosis = 3

Std. normalfordeling

  • gennemsnit: 0
  • std: 1

Enhver normalfordelingen kan standardiseres til std. normalfordelingen:
(yi-ystreg)/SD

Std. normalfordelingen har sin egen sandsynlighedsfordeling: z-fordeling (med kendte sandsynligheder).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

T-fordelingen, hvad er det for noget?

A

Har tykkere “haler” end z-fordelingen - tager højde for usikkerhed ved mindre stikprøver.

Afhænger af antallet af frihedsgarder (n-1) –> jo flere frihedsgrader, jo fladere haler

Mere fleksibel fordeling end z-fordeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er en stokastisk variabel?

A

Stokastisk betyder tilfældighed. En stokastisk variabel bestemmes af en grad tilfældighed, men du kan stadig beregne sandsynligheder.

1) tilfældighed i udvælgelse
2) tilfældighed i svar (reliabilitet)

Det giver usikkerhed. Inferentiel statistik giver et mål for den usikkerhed. Gælder altid, også selvom vi trækker fra populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad er inferens?

A

At gå fra noget observerbart til noget uobserverbart (stikprøve til population)

Generaliserbarhed

Estimater svinger fra stikprøve til stikprøve og er derfor ikke den sande paramenter. Man kan tage fejl

17
Q

Deskriptiv statistik

A

Univariat

  • momenter
  • percentiler / kvartiler
  • fordeling

Bivariat
- betinget gennemsnit E(Y l X=0)

18
Q

Momenter <3

A
  1. moment: gennemsnit (summeret obs / antallet af obs)
  2. moment: varians (kvadreret difference mellem obs og gennemsnit) –> spredning
    - - i stikprøven tages der højde for frihedsgrader (n-1)
  3. moment: skævhed (0=symmetrisk ellers. venstre-/højreskæv)
  4. moment: kurtosis - toppunkt, spids/flad (3=normal. Jo større kurtosis, desto højere toppunkt)
19
Q

Hvad er et mål for usikkerhed

A

Inferentiel statistik (mere end blot deskriptiv). Estimere usikkerheden i en given stikprøve.

20
Q

Hvad er et densityplot?

A

Kondenseret data over stikprøvefordelinger. Arealet under kurven er 1.
Nemt at aflæse, men mindre præcist

Sandsynlighedsfordeling for kontinuerte variable

21
Q

Hvad er forskellen på deskriptiv og kausal inferens

A

Deskriptiv inferens: beskriver en population fra en stikprøve

Kausal inferens: en effektstørrelse i population fra en stikprøve.

22
Q

Cohens D

A

Forskel (eks. i gennemsnit eller effekt) / SD = Cohens D

STandardiseret mål for effektstørrelse

Lille: 0,2
Medium: 0,5
Stor: 0,8

Kan ikke bruges på nominal med 3+ svarkategorier eller dikotome

23
Q

Den empiriske regel (z-score)

A

+/- 1 SD: 68 % sandsynlighed (16 % halesandsynlighed)

+/- 1,96 SD: 95 % sandsynlighed (2,5 % halesandsynlighed)

+/- 3 SD: nærmest alt

24
Q

Hvad er forskellen på kontinuert og diskret variabel?

A

Ikke-tællelig udfaldsrum vs. tællelig.

25
Q

Hvorfor er std. normalfordelingen interessant?

A

Pga. CLT kan vi standardisere enhver stikprøvemålsfordeling og dermed lave inferens! Når vi standardiserer stikprøvemålsfordelingen, så får vi p-værdier for estimatet givet en H0.

26
Q

Hvor ofte vil man trække en stikprøve, som ligger i halen, selvom H0 er sand? (type l fejl!)

A

Afhænger af signifikansniveauet. Typisk 5%

27
Q

Hvordan estimeres standardfejlen?

A

Via standardafvigelsen i stikprøven.

I regressionen bliver det residualerne i stikprøven. Variansen er de kvadrede residualer (MÅSKE?!)

28
Q

Hvorfor bliver SE(beta1/ystreg) mindre af større n?

A

Hvis n=30, da vægter outliers 1/30, mens ved n=1000, da vægter de 1/1000; og bliver altså ikke så betydningsfulde ift. inferens og stikprøvemålsfordelingen.