Statistik Flashcards
Definer kvalitativ data
Opdeler individer i katagorier. Eksempelvis farve, art. Kaldes også nominal skala.
Definer ordinal data
Ligesom nominalskalaen, men bringer orden i målingerne. Sætter målingerne op i en rækkefølge der giver mening.
Definer interval data
Som ordinalskala, men hvor der kan erkendes en afstand imellem hvert punkt, som er den samme mellem hvert punkt. Men der findes intet absolut 0-punkt på en interval skala. Eks: Temperatur.
Definer kvantitativ data
Inkluderer et absolut 0-punkt, hvilket muliggøre at lægge til, trække fra, gange og dividere. Kaldes også ratio skala.
Definer “Mean-værdi”
Den middelværdi vi får, ved at dividere summen af vores sæt af observationer med antallet af observationer. Det er kun mean der bruger alle informationer i et datasæt.
Definer “Median-værdi”
Dette er den midterste af vores observationer, efter at de er blevet rankeret i magnitude.
Eks: Vi har følgende observationer: 4, 8, 9, 12, 15, 25, 202. Her er 12 vores median værdi.
Definer “Mode-værdi”
Også kaldet crude mode. Det er den klasse i en frekvens distrubtion, der indeholder flest observationer.
I en perfekt symmetrisk distrubtion vil mean, median og mode have den samme værdi.
Definer range, spredning og varians:
Range: Forskellen mellem højeste og laveste observation. Range giver altså ingen informationer om distrubtion.
Spredning: Udregnes direkte udfra alle observationerne.
Varians: Varians er kvadraten til spredningen. – Dvs. spredningen er kvadratroden til varians.
Hvad er en normalkurve og hvad kan vi bruge den til?
Distrubtionen fra store prøver udtaget fra en enkelt population vil ofte forme en normalkurve -> Symmetrisk, klokkeformet kurve.
Hvis den vertikale akse re-skaleres ved at dividere med antallet af observationer, fås probability density. Totallen af denne er 1. Total areal under kurven er 100%. På hver side vil der være en standardafvigelse. Totalarealet (100%) minus de to standafvigelser (my ± delta) vil så være være vores P-værdi.
Emperisk regel siger:
1) Middelværdi + 1spredningen = dækker 66,6%
2) Middelværdi + 2spredningen = dækker 95%
3) Middelværdi + 3*spredningen = dækker 99%
Hvad er gældende for henholdvis:
P < 0.05
P < 0.01
P < 0.001
For P gælder det at:
P < 0.05 (signifikant)
P < 0.01 (Highly significant)
P < 0.001 (Very highly significant)
Hvad antager H0 hypotesen?
Antager at der ikke er nogen signifikant forskel.
Hvad antager H1 hypotesen?
Antager at der er en signifikant forskel.
Hvad er type 1 og type 2 fejl?
Type 1 fejl er når H0 bliver afvist, men faktisk er sand. Type 2 fejl er når H0 antages for sand, men faktisk er falsk.
Hvis vi sætter vores p værdi lavere, hvad vil der så ske med antallet af henholdsvis type 1 og type 2 fejl?
Vi kan reducere risikoen for type 1 fejl ved at sætte vores accepterede P-værdi lavere. Dette vil dog så til gengæld øge risikoen for type 2 fejl.
Vi er normalt mest bekymrede for type-1 fejlene.
Hvornår kan man bruge parametriske tests?
Når der er normalfordeling