Statistisk inferens begreber Flashcards

Question

P-værdien

Answer 1

P-værdien er sandsynligheden for at trække en stikprøve og opnå et estimat som afviger mindst lige så meget fra nulhypotesen som det konkrete resultat, givet at H0 er sand.

Answer 2

Data fra flere enheder indsamlet på flere tidspunkter.

Answer 3

Fordelingen i hele populationen på alle mulige værdier. Ofte ukendt

Answer 4

Variable bestemt efter treatment fx holdning, motivation. Her må grupperne gerne variere

Answer 5

Variable bestemt inden treatment fx alder, køn. Her skal grupperne være ens for at sikre mod selektionsbias.

Answer 6

Hvor præcise er vores mål. Hvis vi ønsker at måle sundhed, hvordan gøres dette så. Er IQ et pålideligt mål for intelligens?

Answer 7

hvis der i fravær af treatment er en forskel i gruppernes forventede udfald er der tale om en selektionsbias, da grupperne ikke er ceteris paribus (=alt andet lige).

Answer 8

Fortæller om de fleste store afvigelser ligger over eller under gennemsnittet. <0 venstreskæv >0 højreskæv =0 symmetrisk

Answer 9

Gennemsnitlig afvigelse fra gennemsnittet. Kan siger noget om relativ størrelse af forskel/effekt.

Answer 10

* Standardfejlen er standardafvigelsen i stikprøven - den gennemsnitlige afvigelse fra gennemsnittet i stikprøvemålsfordeling. Altså et udtryk for hvor meget vores estimat vil variere fra stikprøve til stikprøve. * Standardfejlen kan estimeres ved at dividere standardafvigelsen i stikprøven med kvadratroden af antal observationer. * Standardfejlen bruges til at beregne t-værdier - hvor mange standardfejl ligger estimatet fra testværdien givet ved nulhypotesen. t-værdien bliver større når standardfejlen bliver mindre. t-værdien kan vi sidenhen bruge til at finde p-værdien. Jo lavere standardfejl, jo højere t-værdi og jo lavere p-værdi

Answer 11

klokke formet og symmetrisk fordeling med Gennemsnittet μ=0, standard afvigelse σ=1. Alle normalfordelinger kan standardiseres dvs. gøres til standard normalfordeling. Dette kaldes også en z-transformation.

Answer 12

Er et værktøj til at undersøge og afgøre med hvor høj sikkerhed et stikprøveresultat kan generaliseres til en population. Der vil altid være en usikkerhed, ofte vil man sige at populationens gennemsnit ligger inden for X af stikprøven.

Answer 13

Fordelingen i stikprøven på alle mulige værdier. viser statistik på én enkelt stikprøve - fx varians og gennemsnit.

Answer 14

* Vi forestiller os at vi trækker uendeligt mange stikprøver og finder fx gennemsnittet af hver stikprøve. Stikprøvemålsfordelingen vil være fordelingen af disse gennemsnit. * viser statistik på uendeligt mange stikprøver - fx gennemsnittet i alle stikprøver. Ud fra stikprøvemålsfordelingen kan man fx finde det gennemsnitlige gennemsnit i stikprøverne (Y-streg) og den gennemsnitlige standardafvigelse (standardfejlen) .

Answer 15

Bestemt med et element af tilfældighed, men det er muligt at beregne og analysere usikkerheden ved denne tilfældighed.

Answer 16

Treatment tildelt i survey fx nogen der får særligt information inden spørgsmål.

Answer 17

Variere ikke efter måletidspunkt fx køn, social baggrund

Answer 18

Data for en enhed indsamlet på flere tidspunkter.

Answer 19

Variere muligvis efter måletidspunkt fx holdninger, værdier.

Answer 20

Gennemsnitlig kvadrerede afvigelse fra gennemsnittet. Ofte bruger man dog standardafvigelsen som er kvadratroden af variansen

Answer 21

At gøre en normalfordeling til en standard normalfordeling. Samme som standardisering. Subtraherer gennemsnit og dividere med standardafvigelse

Answer 22

t-værdien er antallet af standardafvigelser som den observerede værdi ligger fra den forventede værdi (givet nulhypotesen). Det er her vi bruger 1,96 når vi snakker 95% konfidensinterval.

Answer 23

P-værdien = arealet til højre for t-værdien OG arealet til venstre for t-værdien. Her sætter vi en ikke en retning på. Er mere konservativ end en en-sidet test, da den kræver dobbelt: P to-sidet =2*p en-sidet

Answer 24

P-værdien = arealet til højre for t-værdien Eller arealet til venstre for t-værdien. Her sætter vi en retning på og ser kun på den ene side.

Answer 25

Når vi afviser H0 selvom den er sand -> falsk positiv Risikoen for dette svare til signifikansniveauet fx 0,05 (=5%)

Answer 26

Falsk negativ - vi accepterer H0 selvom den er falsk. Det er når signifikansniveauet er meget lavt. Risikoen for dette afhænger af type 1 fejlen. Des højere signifikansniveau jo større risiko for type 2 fejl. Afhænger også af hvad, der er sandt ude IRL. * Sandheden langt fra H0 = lille sandsynlighed for type 2 fejl * Meget information/data = lille sandsynlighed for type 2 fejl