Sandsynlighedsregning Flashcards
P-værdi
- Definition: Hvis nulhypotesen er sand, så er p-værdien sandsynligheden for at få en stikprøve, som ligeså eller mere ekstrem end vores egen
- P-værdien fortæller noget om, hvor sandsynligt det er, at resultatet skyldes tilfældigheder, givet at nulhypotesen er sand
- P-værdien siger noget om usikkerheden i stikprøven
Median
Den midterste værdi i et sorteret datasæt.
Ligesom middelværdien og typetallet, er medianen en måde at beskrive middeltendensen i et datasæt. Medianen benævnes også 2. kvartil eller medianværdien.
Hvad er en stokastisk variabel?
Et tal der knyttes til en hændelse fx. Ja = 1 og Nej = 0
En variabel som omskriver en hændelse til et tal
Beskriv den Store Tals lov
Gennemsnittet af en række uafhængige stokastiske variable, der alle har samme sandsynlighedsfordeling, nærmer sig den sande middelværdi når n går mod uendelig
Den midterste værdi i datatsættet, når data er ordnet i rækkefølge efter størrelse.
Median
Hyppighed divideret med det samlede antal
Frekvens
Hvad er middelværdien?
Middelværdien er gennemsnittet i den rigtige population, som stikprøven er taget fra!
Udregnes på samme måde som gennemsnittet: summen af observationer / antallet af observationer
Hvad er en hypotesetest ?
Det er en undersøgelse om der er forskel på grupperne.
Hvad er et sikkerhedsinterval/konfidensinterval?
- Baseret på en tilfældig udvalg stikprøve ligger den sande parameterværdi med 95% sandsynlighed indenfor dette interval
- i 95 ud af 100 gentagelser vil den sande parameterværdi altså ligge indenfor konfidensintervallet.
- Estimatet (fx. OR, gamma, mm) indgår også i dette interval
Hvad afhænger konfidensintervallets bredde af?
- Stikprøvens varians
- lav variation = smalt interval
- høj variation = bredt interval
- Stikprøvens størrelse (og dermed SE)
- lille størrelse = bredt interval
- stor størrelse = smallere interval
Hvordan udregnes konfidensintervallet?
- x = estimat
- SE (X) standardfejlen på estimatet
- 1,96 = konstant (95% konfidensinterval)
- Den nedre grænse -1,96
- Den øvre grænse: +1,96
Beskriv normalfordelingen
- Hvis man har en stor population og ønsker at vide noget om deres højde.
- Så tager man uafhængige stikprøver ud og finder gennemsnittet af deres højde.
- Jo flere gennemsnit af højder fra sub-populationer man har, jo mere vil GENNEMSNITTET være normalfordelt omkring den sande middelværdi for hele populationen.
Hvad er inferens?
Når man på baggrund af en stikprøve udtaler sig om en population
Hvordan udregnes normalfordelingen?
Hvis jeg har noget som er normalfordelt hvor vil 95% af observationerne så ligge?
- Nedre grænse: μ - 1,96 * σ*
- Øvre grænse: μ + 1,96 * σ*
= 95% af observationerne ligger i dette interval
σ = Standardafvigelse μ = middelværdi
Hvad gør den standardiserede normalfordeling?
Indrammer det område, hvor 95% af data ligger
Middelværdi = 0
Standardafvigelse = 1