Kap 6 Flashcards
Variabel for normalfordeling.
Normalfordeling: Kvantitativ variabel
Sandsynlighedsfordelinger for diskrete og kontinuerte variable.
Sandsynlighedsfordelinger for diskrete variabler vises med søjlediagrammer.
Sandsynlighedsfordelinger for kontinuerte variable vises med kurver. Her er der uendelig mange værdier, dvs. punkter.
Hvad er den vigtigste fordeling inden for statistik?
Normalfordeling (klokkeformet og symmetrisk).
Mange statistiske metoder anvender normalfordelingen selv om data ikke følger en ”klokkeform”
Normalfordelingen er et værktøj til at beregne sandsynligheder og usikkerhed i forbindelse med statistiske analyser
Hvad karakteriserer en normalfordeling?
Normalfordelingen er
Klokkeformet og symmetrisk omkring middelværdien
Når middelværdien stiger eller falder flytter kurven sig langs X-aksen
Stigende/faldende standardafvigelse fortæller noget om spredningen i data (”Halernes tykkelse”)
Regel vedr. Standardafvigelser fra middelværdi
68% af observationerne falder I intervallet +/- 1 standaradafvigelse fra middelværdien
95% af observationerne falder I intervallet +/- 2 standaradafvigelser fra middelværdien
99.7% af observationerne falder I intervallet +/- 3 standardafvigelser fra middelværdien
Middelværdi og standardafvigelse for en standardnormalfordeling.
En standardnormalfordeling har Middelværdi = 0 og Standardafvigelse =1
Z-score
Z-scoren udtrykker afstanden fra middelværdien i antal standardafvigelser.
Formel: Z = (x – my) / sigma
En negativ Z-score viser at værdien er mindre end middelværdien
En positiv Z-score fortæller os, at værdien er større end middelværdien
Variabel for binomialfordeling.
Binomialfordeling: Kategori variabel
Kort intro til binomialfordeling.
Hver observation har to og kun to mulige udfald (succes og fiasko)
Binomialfordelingen beskriver sandsynligheden for at få k succeser i n forsøg
Forudsætninger der skal være opfyldt for binomialfordeling
Hvert af de n forsøg/eksperimenter har to og kun to mulige udfald. Det udfald vi interesserer os for kaldes ”Succes” mens det andet udfald kaldes ”Fiasko”
I hvert eksperiment er sandsynligheden for succes den samme
Sandsynligheden for succes betegnes p
Sandsynligheden for fiasko betegnes 1-p
De n forsøg/eksperimenter er uafhængige.
Dvs udfaldet af et forsøg/eksperiment vil ikke påvirke udfaldet af et andet forsøg/eksperiment
Den binomialfordelte stokastiske variabel X udtrykker antallet af successer i n forsøg/eksperimenter
Formel for my og sigma
My = n * p sigma = kvadratrod(n * p (1-p))
Normalfordelingen som approximation for binomialfordelingen
Når n er høj kan binomialfordelingen ifølge den centrale grænseværdisætning approximeres ved en normalfordeling med samme middelværdi og standardafvigelse