Biostatistik 2 Flashcards

1
Q

Vad är slumpmässighet?

A
  • Där ett utfall inte kan förutsägas utan följer en sannorlikhetsförordning
  • Bygger på oberoende händelser eller mätningar och följer en fördelning
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är ett utfall?

A
  • Refererar till det specifika resultatet av en slumpmässig händelse eller experiment
  • Varje gång en slumpmässig process eller studie genomförs, observeras ett specifikt resultat (utfall), och detta kan vara ett av många
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Olika typer av utfall?

A
  • Kvantitativa utfall (kontinuerliga eller diskreta)
  • Kvalitativa utfall /kategoriska
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är kvantitativa utfall?

A
  • Kontinuerliga:
    ->Dessa utfall kan anta ett oändligt antal värden inom ett visst intervall
  • Diskreta:
    -> Dessa utfall begränsas till ett bestämt antal möjliga värden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad är kvalitativa/ kategoriska utfall?

A
  • Har ej ett numeriskt värde
  • Inom olika skalnivåer
    -> Rangårdnade
    -> Ej rangordnade
  • Binära (dikotoma):
    -> Två möjliga utfall (ex. ja/nej)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är statistisk felmarginal?

A
  • Osäkerhet i sitt datamaterial
  • Den variation och osäkerhet som finns i resultaten från en statistisk analys och hur mycket vi kan lita på att de slutsatser vi drar från data faktiskt speglar verkligheten
  • Det finns alltid en viss grad osäkerhet om hur väl resultaten speglar den verkliga populationen eftersom vi samlar data från ett urval
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad är ett konfidensintervall?

A
  • Ett statistiskt verktyg som ger oss ett spann av möjliga värden för en parameter, där vi med en viss konfidensnivå (95%) kan vara säkra på att det sanna värdet för populationen ligger inom detta intervall
  • Representerar sannolikheten att intervallet kommer att innehålla det sanna värdet om vi upprepar mätningen många gånger
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Varför är konfidensintervall så viktigt?

A

Osäkerhet i uppskattning:
- Konfidensintervall ger oss bättre förståelse för osäkerheten i våra resultat
- Istället för att bara ange ett punktestimat (ex. medelvärde), får vi också en uppfattning av variationen och den möjliga osäkerheten i våra resultat

Tydliga resultat:
- Genom ett intervall istället för ett ensklit värde kan vi kommunicera resultat på ett mer nyanserat sätt
- Om ett konfidensintervall för ett medelvärde inte inkluderar noll, kan vi dra slutsatsen att effekten är statistiskt signifikant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är standardfel (SD)?

A
  • Spridningen av stickprovets medelvärde kring det sanna populationens medelvärde
  • Används för att beräkna konfidensintervall och p-värden och är en central komponent i många statistiska tester
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Skillnad mellan standardavvikelse (SD) och standardfel (SE)?

A

SD:
- Variation i data
- Spridningsmått för att visa på den variation som finns i datamaterialet
- Skattning av variationen som också finns i den större målpopulationen

SE:
- Osäkerhet i ett uppskattat värde (ex. medelvärde)
- Beskriver precisionen av skattningen av populationsmedelvärdet
- ytterligare beskrivning av SD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är ett referensintervall?

A
  • Intervallet där majoriteten av friska individer förväntas hamna inom när vi gör en analys av en hälsomarkör (normalt, avvikelse=sjukdom/risk)
  • Används ofta för bedömning av provsvar och diagnostik
  • Vid en normalfördelning hamnar ca. 5% av populationen utanför referensintervallet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

7 steg för arbetsgång för statistiska analyser?

A

1) Förutsättning: Signifikansnivå är P=0,05
2) Formulera nollhypotes: H0
3) Anta att H0 är sann i det här stadiet
4) Samla in data för att se om data stödjer H0
5) Statistiska beräkningar (medelvärde, KI)
6) Sedan görs ett statistiskt test som ger ett P-värde
7) Baserat på P-värdet behåller eller förkastar vi H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Skillnaden mellan SD och KI?

A

SD:
- Mäter variationen i en datamängd
- Beskriver hur data varierar kring medelvärdet
- Beräknad direkt från data

KI:
- Ger ett intervall för en parameter i en population baserat på ett stickprov
- Beskriver osäkerheten i en uppskattning av en parameter
- Beräknas från ett stickprov och tar hänsyn till både variation i data och stickprovsstorlek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är ett p-värde?

A

P-värde:
- Värde som avgör om ett observerat resultat är statistiskt relevant eller inte
- Ett mått på osäkerheten i hypotesprövningen
- Ett lågt P-värde (under 0,05) indikerar att det är osannolikt att resultatet beror på slumpen
- Ett högt P-värde tyder på större osäkerhet om resultatets statistiska signifikans

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är signifikansnivå (alfa)?

A

Signifikansnivå (alfa):
- Anger den maximala risken att felaktigt förkasta nollhypotesen när den faktiskt är sann (typ 1-fel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hur redovisar man P-värden?

A
  • Enstjärnig signifikans (*)
    -> P-värdet är mindre eller lika med 0,05
  • Tvåstjärning signifikans (**)
    -> P-värdet är mindre eller lika med 0,01
  • Trestjärnig signifikans (***)
    -> P-värdet är mindre eller lika med 0,001
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad är hypotesprövning?

A
  • En statistisk metod som används för att testa om en hypotes om en population är sann eller inte, baserat på ett urval av data
  • Man använder data för att bedöma om det finns tillräckligt bevis för att stödja eller förkasta en specifik hypotes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad är en nollhypotes?

A

H0:
- Det antagandet vi testar mot
- Ofta att det inte finns någon effekt eller skillnad på ex. en behandling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vad är en alternativhypotes?

A

H1:
- Det antagande vi vill visa
- Ofta att det finns effekt eller skillnad på ex. en behandling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Faktorer att ta hänsyn till valet av statistiskt test?

A

Typ av utfallsvariabel:
- Kvalitativ
- Kategorisk

Antal grupper:
- 1, 2 eller >2

Parametriska vs. icke parametriska test

Oberoende eller beroende observationer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

När använder man ett parametriskt test?

A
  • Om data är kontinuerlig
  • Normalfördelning kan antas
  • Homogenitet av varians kan antas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Exempel på parametriska test?

A
  • t-test
  • ANOVA
23
Q

När använder man ett icke - parametriskt test?

A
  • När data är ordinala eller inte normalfördelad
  • När data innehåller outliers eller avvikelser från normalfördelningen
24
Q

Exempel på icke-parametriska test?

A
  • Mann-Whitney U-test
  • Kruskal-Wallis test
25
Q

Skillnad mellan beroende och oberoende observationer?

A

Beroende:
- Om observationerna är relaterade
-> Ex. samma individer före och efter behandling

Oberoende:
- Om observationerna i gruppen inte påverkar varandra
-> Ex. jämförelse mellan behandlingsgrupp och kontrollgrupp

26
Q

Vilka statistiska test baseras på medelvärde/ medelrankningar?

A
  • Oberoende t-test
  • Parat t-test
  • ANOVA
  • Kruskal-Wallis test
  • Mann-Whitney U-test
27
Q

Oberoende t-test:
Grupper, antaganden och användning

A

Grupper: 2 oberoende

Antaganden:
- normalfördelad data
- oberoende grupper
- homogen varians (lika spridning i båda grupper)

Användning:
- Jämföra medelvärden

28
Q

Parat t-test:
Grupper, antaganden och användning

A

Grupper: 1 grupp, 2 beroende provtagningar - parade mätningar

Antagande:
- normalfördelad data
- beroende grupper

Användning:
- Jämföra medelvärde innan och efter intervention

29
Q

ANOVA:
Grupper, antaganden och användning

A

Grupper: 3+ oberoende

Antagande:
- normalfördelad data
- oberoende grupper
- homogen varians (lika spridning i båda grupper)

Användning:
- Jämföra medelvärden

30
Q

Kruskal - Wallis test:
Grupper, antaganden och användning

A

Grupper: 3+ oberoende

Antagande:
- ingen specifik fördelning av data
- Oberoende grupper

Användning:
- Jämföra medelrankningar

31
Q

Mann-Whitney U-test:
Grupper, antaganden och användning

A

Grupper: 2 oberoende

Antagande:
- Data behöver inte vara normalfördelad
- Oberoende grupper

Användning:
- Jämföra medelrankningar

32
Q

Fördelar med statistiska analyser baserade på medelvärde/ medelrankningar?

A
  • Effektivt vid normalfördelad data
    -> Utnyttjar hela datamängden och gör full användning av informationen
  • Effektivt vid statistiska test
    -> Användbart vid parametriska test som bygger på antagandet om normalfördelning
33
Q

Nackdelar med statistiska analyser baserade på medelvärde/ medelrankningar?

A
  • Känslighet för extremvärden (outliers)
    -> Medelvärder kan bli snevridet och ge missvisande bild av det centrala värdet
34
Q

Vilka test används för att jämföra proportioner?

A
  • Fishers exact test
  • Chi-squared test
35
Q

När görs medianjämförelser istället för medelvärdesjämförelser?

A
  • Genomförs då förutsättningar för t-test inte är uppfyllda
    -> Inte normalfördelad
    -> Inga stora grupper
36
Q

Vilka tester finns det som gör medianjämförelser?

A
  • Teckentest
  • Wilcoxons signed-rank test
  • Mann - Whitney U-test (Wilcoxons rank-sum test)
  • Kruskal-Wallis test
37
Q

Wilcoxon Signed-rank test:
Grupper, antaganden och användning

A

Grupper: Beroende - Parade mätningar

Antaganden:
- Beroende grupper
- Data behöver inte vara normalfördelad

Användning:
- Jämföra medianer

38
Q

Mann-Whitney U-test (Wilcoxon rank-sum test):
Grupper, antaganden och användning

A

Grupper: 2 oberoende

Antagande:
- Oberoende grupper
- Data behöver inte vara normalfördelade

Användning:
- Jämföra medianer

39
Q

Kruskal - Wallis test:
Grupper, antaganden och användning

A

Grupper: 3+ oberoende

Antagande:
- Oberoende grupper
- Data behöver inte vara normalfördelad

Användning:
- Jämföra medianer

40
Q

Fördelar med statistiska analyser baserade på median?

A
  • Inte känsliga för outliers
    -> Påverkas endast av placeringen av värdena i mitten av datasetet
    -> Särskilt användbar vis asymetrisk fördelning
  • Användbar vid snedfördelad data
    -> Ger en mer representativ bild av det centrala värdet än medelvärdet
41
Q

Nackdelar med statistiska analyser baserade på median?

A
  • Mindre användbar vid normalfördelning
    -> Vid normalfördelning är median lika eller mycket nära varandra
    -> Onödigt att använda median då
  • Begränsad information
    -> Medianen är inte lika effektiv som medelvärdet när det gäller att få ut full information från data, särsklit vid symmetrisk fördelning
42
Q

När ska man använda medelvärde vs. median?

A

Medelvärde:
- Normalfördelad data
-> t-test, ANOVA

Median:
- Snedfördelad data
- Vid extremvärden
- Om datan är ordinal
-> Mann-Whitney U-test, Kruskal-Wallis test

43
Q

Vad betyder det om data är normalfördelad?

A
  • De flesta observationer ligger kring medelvärdet
  • Möjliggör beräkning av hur stor andeö av alla observationer som finns inom ett visst antal standardavvikelser från medelvärdet
44
Q

Hur kan data vara fördelad?

A
  • Symmetrisk fördelning -> Normalfördelad
  • Positiv snedfördelning
  • Negativ snedfördelning
45
Q

Vad är statistisk styrka?

A
  • Sannolikheten att korrekt förkasta nollhypotesen när den är falsk
    -> Upptäcke en verklig effekt om den finns
  • Ett mått på hur känsligt ett statistiskt test är
46
Q

Faktorer som påverkar den statistiska styrkan?

A
  • Effektstorlek
  • Provstorlek
  • Signifikansnivå (alfa)
  • Variabilitet i data
  • Testets design
47
Q

Hur påverkar effektstorlek den statistiska styrkan?

A
  • Ju större den verkliga effekten är, desto lättare är det att upptäcka den
48
Q

Hur påverkar provstorlek (n) den statistiska styrkan?

A
  • Ju större provstorlek, desto större chans att upptäcka en verklig effekt
  • Ett större urval ger mer pålitliga resultat och minskar risken får att missa effekt
49
Q

Hur påverkar signifikansnivån (alfa) den statistiska styrkan?

A
  • Om vi höjer tröskelvärdet för att förkasta H0 (ex. 0,1) ökar den statistiska styrkan eftersom vi har ett större intervall där H0 får stämma
  • Ökas tröskeln är dock risken att begå ett typ 1 fel (falskt positivt) större
    -> Innebär att man förkastar en sann H0
    —->
  • Vid alfa 0,05 där 6 personer “bekräftar” H0 är signifikansen för hög och H0 förkastas ej
  • Vid alfa 0,1 där 6 personer “bekräftar” H0 är signifikansen låg nog att förkasta H0
    —-> Detta kan på det viset leda till en felaktig förkastning av H0
50
Q

Hur påverkar variabilitet i data den statistiska styrkan?

A
  • Om det finns mycket variabilitet i data, blir det svårare att upptäcka en effekt, vilket minskar styrkan
51
Q

Hur påverkar testets design den statistiska styrkan?

A
  • Olika typer av statistiska tester har olika nivåer av styrka beroende på hur de är utformade och vilken typ av data de använder
52
Q

Vad innebär det om ett test har en hög statistisk styrka?

A
  • Testet har en hög sannolikhet att korrekt identifiera en verklig effekt om den finns
53
Q

Vad innebär det om ett test har en låg statistisk styrka?

A
  • Testet har en högre risk att missa verkliga effekter och därmed dra felaktiga slutsatser
    -> Typ 2 fel (falskt negativa)
54
Q

Typer av fel i hypotesprövningar?

A

Typ 1 fel:
- Falskt positivt resultat
- Förkastar H0 när den egentligen är sann
- Detta sker om P-värdet är mindre än alfa men det verkliga resultatet inte visar en direkt skillnad

Typ 2 fel:
Falskt negativt resultat
- Accepterar H0 när den egentligen är falsk
-> Detta sker om P-värdet är större än alfa, men det verkliga resultatet visar en skillnad