Statistikk Flashcards
Mean
Gjennomsnittet, brukes ved normalfordeling av data.
Median
Medianen, brukes ved skjevhet i fordelingen av data
Mode
Verdien som gjentas oftest
Range
Forskjellen mellom den største og minste verdien
Interquartile range
Fordeler i 4 like deler (Q1-4). Avstanden mellom Q1-3 er interquartile range, 50% som er i midten av datasettet.
Box plot
graf som visualiserer spredningen av data med range, median og interquartile range.
Central tendency
Sentraltendens
Der hvor hoveddelen av dataene befinner seg.
Normalfordeling: mean, median og mode lik.
Skjevhet: bruk median.
Variance s²
Varians
Hvor mye dataene varierer fra gjennomsnittet.
V=⨊(x-ẍ)²/n-1
Standardavvik (deviation) sd
Variasjonen i datasettet, basert på mean.
Blir beskrevet som ẍ ± sd
Kvadratrota av variansen
√s² = √ (⨊(x-ẍ)²/n-1)
Mean absolute deviation (MAD)
absolutt avvik
Gjennomsnittlig forskjell mellom hvert datapunkt og gjennomsnittet.
(x1-mean)+(x2-mean)…/N
tilfeldig vs systematisk skjevhet
Tilfeldig: Uforutsigbar, går i alle retninger. gjenspeiles i beregnet usikkerhet (CI) og størrelsen på studien
Systematisk: Forutsigbare feilmålinger. Alle målingene har samme feilmargin. metodiske svakheter og bias.
Signifikans
sannsynligheten for at den observerte forskjellen skyldes tilfeldigheter.
Vurderes ut i fra nullhypotesen og signifikansnivå (p-verdien)
𝒶 = maximal akseptert risiko for å gjøre type 1 feil.
Type 1 feil
Man forkaster nullhypotesen selv om den er sann
Type 2 feil
Beholder nullhypotesen selv om den er usann
P verdi
Sannsynligheten for å oppnå akkurat det resultatet hvis H0 er sann.
P < 𝑎 –> forkast H0
Sannsynligheten for at resultatet er lik/mer ekstremt dersom nullhypotesen stemmer