Statistikk Flashcards

1
Q

Mean

A

Gjennomsnittet, brukes ved normalfordeling av data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Median

A

Medianen, brukes ved skjevhet i fordelingen av data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Mode

A

Verdien som gjentas oftest

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Range

A

Forskjellen mellom den største og minste verdien

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Interquartile range

A

Fordeler i 4 like deler (Q1-4). Avstanden mellom Q1-3 er interquartile range, 50% som er i midten av datasettet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Box plot

A

graf som visualiserer spredningen av data med range, median og interquartile range.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Central tendency
Sentraltendens

A

Der hvor hoveddelen av dataene befinner seg.
Normalfordeling: mean, median og mode lik.
Skjevhet: bruk median.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Variance s²
Varians

A

Hvor mye dataene varierer fra gjennomsnittet.
V=⨊(x-ẍ)²/n-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Standardavvik (deviation) sd

A

Variasjonen i datasettet, basert på mean.
Blir beskrevet som ẍ ± sd
Kvadratrota av variansen
√s² = √ (⨊(x-ẍ)²/n-1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Mean absolute deviation (MAD)
absolutt avvik

A

Gjennomsnittlig forskjell mellom hvert datapunkt og gjennomsnittet.
(x1-mean)+(x2-mean)…/N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

tilfeldig vs systematisk skjevhet

A

Tilfeldig: Uforutsigbar, går i alle retninger. gjenspeiles i beregnet usikkerhet (CI) og størrelsen på studien
Systematisk: Forutsigbare feilmålinger. Alle målingene har samme feilmargin. metodiske svakheter og bias.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Signifikans

A

sannsynligheten for at den observerte forskjellen skyldes tilfeldigheter.
Vurderes ut i fra nullhypotesen og signifikansnivå (p-verdien)
𝒶 = maximal akseptert risiko for å gjøre type 1 feil.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Type 1 feil

A

Man forkaster nullhypotesen selv om den er sann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Type 2 feil

A

Beholder nullhypotesen selv om den er usann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

P verdi

A

Sannsynligheten for å oppnå akkurat det resultatet hvis H0 er sann.
P < 𝑎 –> forkast H0

Sannsynligheten for at resultatet er lik/mer ekstremt dersom nullhypotesen stemmer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

t-test

A

tester om det er signifikant forskjell fra nullhypotesen, mellom gjennomsnittet av to normalfordelte datasett.
Enten paret (samme utvalg) eller uavhengig
Gir en p-verdi.

16
Q

Populasjon varians
Sample varians

A

𝜎²=⨊(X-𝜇)²/N
s²=⨊(x-ẍ)/n-1 –> Unbiased estimat av 𝜎²

𝜇= mean of population
N= deltakere i utvalget
n= deltakere i en gruppe

17
Q

Varianskoeffisiens
Coeffisient of variation

A

Ratioen på variasjonen, oppgis i %
Nyttig når to fordelinger (med ulik benevning) skal sammenlignes
cv= (sd/ẍ)*100

18
Q

Normal distribusjon

A

Normal fordeling der mean, median og mode er lik.
ẍ±1sd = 68,26% av dataene
ẍ±2sd = 95,45% av dataene
ẍ±3sd =99,73% av dataene

19
Q

z-scores

A

standardized scores.
Tall på hvor mange sd fra gjennomsnittet en observasjon ligger.
Gjennomsnittet er 0z
z= (x-ẍ)/sd
(observert verdi - gjennomsnitt, delt på sd)

20
Q

Sannsynlighet/probablity

A

Hvor sannsynlig det er at noe skjer.
Tall på hvor godt datasettet estimerer kjennetegn i en populasjon og faren for at en observert effekt har oppstått tilfeldig

21
Q

Standard feil
Standard error of the mean

A

Et tall på hvor forskjellig populasjonens mean er fra utvalgs mean. Sier noe om hvor mye utvalgs mean vil variere ved gjentatte studier i samme populasjon.

sẍ= s/√n

22
Q

Konfidens intervall

A

Et intervall som vi med høy sikkerhet kan si at inneholder den sanne verdien til en populasjon.
Oppgitt som 95 eller 99%. 99% er mer sensitiv.
basert på sample mean (ẍ) og standardfeil (sẍ)
CI = ẍ± (z)sẍ

23
Q

Null/statistisk hypotese

A

H0: 𝜇ª=𝜇ᴮ
Gjennomsnittet er ikke forskjellig

24
Q

Alternativ hypotese

A

H1: 𝜇ª≠𝜇ᴮ
Forskjell i mean, større enn ved risiko for tilfeldighet.
Intervensjonen er effektiv.

25
Q

Statisical power

A

Evnen til å finne signifikant effekt når den finnes. Sannsynligheten for at en test fører til forkastning av H0.
Basert på PANE: Power (1-ℬ), signifikansnivå (𝒶), utvalgsstørrelse (n) og effekt størrelse.
P= 1-ℬ
ℬ= type 2 feil

26
Q

Effekt størrelse

A

Hvor uttalt forskjellen er.
lav= 20% av 1sd
medium= 50% av 1sd
høy= 80% av 1sd

27
Q

Two tailed test

A

non-directional, gir en critical region på begge sidene

28
Q

One tailed test

A

Directional, ønske om å forkaste H0
Critical region er på en side.

29
Q

ROC curve

A

Receiver operating characteristic
viser forholdet mellom å få sanne og falske resultat. Sensitivitet vs spesifisitet, viser styrken på diagnostisk nøyaktighet.
Brukes til å vurdere cut-off verdi.

30
Q

Cut-off

A

Påvirker sensitivitet og spesifisitet
Hva er effekten av falske positive eller negative tester.

31
Q

Reliabilitet
Relative og absolutt

A

Relative: Hvor stor del av dataen er sann (0,00-1,00), beskrives som intraclass correlation coeffisiens
Absolutt: hvor mye av den målte verdien er pga feil. Standard measurement og error gir ± tall. Målt verdi ± MES inneholder den sanne verdien.

32
Q

Minimal detectable change

A

MDC lavere ved høy reliabilitet.
Forskjellen fra pre til post test må være større enn en viss verdi for å være gyldig.

33
Q

Sampling error

A

Forskjellen mellom utvalgets og populasjonens verdier. Ofte en tilfeldig variasjon.