Biostatistik 2 Flashcards

1
Q

Vad är slumpmässighet?

A
  • Där ett utfall inte kan förutsägas utan följer en sannorlikhetsförordning
  • Bygger på oberoende händelser eller mätningar och följer en fördelning
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är ett utfall?

A
  • Refererar till det specifika resultatet av en slumpmässig händelse eller experiment
  • Varje gång en slumpmässig process eller studie genomförs, observeras ett specifikt resultat (utfall), och detta kan vara ett av många
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Olika typer av utfall?

A
  • Kvantitativa utfall (kontinuerliga eller diskreta)
  • Kvalitativa utfall /kategoriska
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är kvantitativa utfall?

A
  • Kontinuerliga:
    ->Dessa utfall kan anta ett oändligt antal värden inom ett visst intervall
  • Diskreta:
    -> Dessa utfall begränsas till ett bestämt antal möjliga värden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad är kvalitativa/ kategoriska utfall?

A
  • Har ej ett numeriskt värde
  • Inom olika skalnivåer
    -> Rangårdnade
    -> Ej rangordnade
  • Binära (dikotoma):
    -> Två möjliga utfall (ex. ja/nej)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är statistisk felmarginal?

A
  • Osäkerhet i sitt datamaterial
  • Den variation och osäkerhet som finns i resultaten från en statistisk analys och hur mycket vi kan lita på att de slutsatser vi drar från data faktiskt speglar verkligheten
  • Det finns alltid en viss grad osäkerhet om hur väl resultaten speglar den verkliga populationen eftersom vi samlar data från ett urval
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad är ett konfidensintervall?

A
  • Ett statistiskt verktyg som ger oss ett spann av möjliga värden för en parameter, där vi med en viss konfidensnivå (95%) kan vara säkra på att det sanna värdet för populationen ligger inom detta intervall
  • Representerar sannolikheten att intervallet kommer att innehålla det sanna värdet om vi upprepar mätningen många gånger
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Varför är konfidensintervall så viktigt?

A

Osäkerhet i uppskattning:
- Konfidensintervall ger oss bättre förståelse för osäkerheten i våra resultat
- Istället för att bara ange ett punktestimat (ex. medelvärde), får vi också en uppfattning av variationen och den möjliga osäkerheten i våra resultat

Tydliga resultat:
- Genom ett intervall istället för ett ensklit värde kan vi kommunicera resultat på ett mer nyanserat sätt
- Om ett konfidensintervall för ett medelvärde inte inkluderar noll, kan vi dra slutsatsen att effekten är statistiskt signifikant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är standardfel (SD)?

A
  • Spridningen av stickprovets medelvärde kring det sanna populationens medelvärde
  • Används för att beräkna konfidensintervall och p-värden och är en central komponent i många statistiska tester
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Skillnad mellan standardavvikelse (SD) och standardfel (SE)?

A

SD:
- Variation i data
- Spridningsmått för att visa på den variation som finns i datamaterialet
- Skattning av variationen som också finns i den större målpopulationen

SE:
- Osäkerhet i ett uppskattat värde (ex. medelvärde)
- Beskriver precisionen av skattningen av populationsmedelvärdet
- ytterligare beskrivning av SD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är ett referensintervall?

A
  • Intervallet där majoriteten av friska individer förväntas hamna inom när vi gör en analys av en hälsomarkör (normalt, avvikelse=sjukdom/risk)
  • Används ofta för bedömning av provsvar och diagnostik
  • Vid en normalfördelning hamnar ca. 5% av populationen utanför referensintervallet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

7 steg för arbetsgång för statistiska analyser?

A

1) Förutsättning: Signifikansnivå är P=0,05
2) Formulera nollhypotes: H0
3) Anta att H0 är sann i det här stadiet
4) Samla in data för att se om data stödjer H0
5) Statistiska beräkningar (medelvärde, KI)
6) Sedan görs ett statistiskt test som ger ett P-värde
7) Baserat på P-värdet behåller eller förkastar vi H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Skillnaden mellan SD och KI?

A

SD:
- Mäter variationen i en datamängd
- Beskriver hur data varierar kring medelvärdet
- Beräknad direkt från data

KI:
- Ger ett intervall för en parameter i en population baserat på ett stickprov
- Beskriver osäkerheten i en uppskattning av en parameter
- Beräknas från ett stickprov och tar hänsyn till både variation i data och stickprovsstorlek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är ett p-värde?

A

P-värde:
- Värde som avgör om ett observerat resultat är statistiskt relevant eller inte
- Ett mått på osäkerheten i hypotesprövningen
- Ett lågt P-värde (under 0,05) indikerar att det är osannolikt att resultatet beror på slumpen
- Ett högt P-värde tyder på större osäkerhet om resultatets statistiska signifikans

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är signifikansnivå (alfa)?

A

Signifikansnivå (alfa):
- Anger den maximala risken att felaktigt förkasta nollhypotesen när den faktiskt är sann (typ 1-fel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hur redovisar man P-värden?

A
  • Enstjärnig signifikans (*)
    -> P-värdet är mindre eller lika med 0,05
  • Tvåstjärning signifikans (**)
    -> P-värdet är mindre eller lika med 0,01
  • Trestjärnig signifikans (***)
    -> P-värdet är mindre eller lika med 0,001
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad är hypotesprövning?

A
  • En statistisk metod som används för att testa om en hypotes om en population är sann eller inte, baserat på ett urval av data
  • Man använder data för att bedöma om det finns tillräckligt bevis för att stödja eller förkasta en specifik hypotes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad är en nollhypotes?

A

H0:
- Det antagandet vi testar mot
- Ofta att det inte finns någon effekt eller skillnad på ex. en behandling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vad är en alternativhypotes?

A

H1:
- Det antagande vi vill visa
- Ofta att det finns effekt eller skillnad på ex. en behandling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Faktorer att ta hänsyn till valet av statistiskt test?

A

Typ av utfallsvariabel:
- Kvalitativ
- Kategorisk

Antal grupper:
- 1, 2 eller >2

Parametriska vs. icke parametriska test

Oberoende eller beroende observationer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

När använder man ett parametriskt test?

A
  • Om data är kontinuerlig
  • Normalfördelning kan antas
  • Homogenitet av varians kan antas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Exempel på parametriska test?

A
  • t-test
  • ANOVA
23
Q

När använder man ett icke - parametriskt test?

A
  • När data är ordinala eller inte normalfördelad
  • När data innehåller outliers eller avvikelser från normalfördelningen
24
Q

Exempel på icke-parametriska test?

A
  • Mann-Whitney U-test
  • Kruskal-Wallis test
25
Skillnad mellan beroende och oberoende observationer?
Beroende: - Om observationerna är relaterade -> Ex. samma individer före och efter behandling Oberoende: - Om observationerna i gruppen inte påverkar varandra -> Ex. jämförelse mellan behandlingsgrupp och kontrollgrupp
26
Vilka statistiska test baseras på medelvärde/ medelrankningar?
- Oberoende t-test - Parat t-test - ANOVA - Kruskal-Wallis test - Mann-Whitney U-test
27
Oberoende t-test: Grupper, antaganden och användning
Grupper: 2 oberoende Antaganden: - normalfördelad data - oberoende grupper - homogen varians (lika spridning i båda grupper) Användning: - Jämföra medelvärden
28
Parat t-test: Grupper, antaganden och användning
Grupper: 1 grupp, 2 beroende provtagningar - parade mätningar Antagande: - normalfördelad data - beroende grupper Användning: - Jämföra medelvärde innan och efter intervention
29
ANOVA: Grupper, antaganden och användning
Grupper: 3+ oberoende Antagande: - normalfördelad data - oberoende grupper - homogen varians (lika spridning i båda grupper) Användning: - Jämföra medelvärden
30
Kruskal - Wallis test: Grupper, antaganden och användning
Grupper: 3+ oberoende Antagande: - ingen specifik fördelning av data - Oberoende grupper Användning: - Jämföra medelrankningar
31
Mann-Whitney U-test: Grupper, antaganden och användning
Grupper: 2 oberoende Antagande: - Data behöver inte vara normalfördelad - Oberoende grupper Användning: - Jämföra medelrankningar
32
Fördelar med statistiska analyser baserade på medelvärde/ medelrankningar?
- Effektivt vid normalfördelad data -> Utnyttjar hela datamängden och gör full användning av informationen - Effektivt vid statistiska test -> Användbart vid parametriska test som bygger på antagandet om normalfördelning
33
Nackdelar med statistiska analyser baserade på medelvärde/ medelrankningar?
- Känslighet för extremvärden (outliers) -> Medelvärder kan bli snevridet och ge missvisande bild av det centrala värdet
34
Vilka test används för att jämföra proportioner?
- Fishers exact test - Chi-squared test
35
När görs medianjämförelser istället för medelvärdesjämförelser?
- Genomförs då förutsättningar för t-test inte är uppfyllda -> Inte normalfördelad -> Inga stora grupper
36
Vilka tester finns det som gör medianjämförelser?
- Teckentest - Wilcoxons signed-rank test - Mann - Whitney U-test (Wilcoxons rank-sum test) - Kruskal-Wallis test
37
Wilcoxon Signed-rank test: Grupper, antaganden och användning
Grupper: Beroende - Parade mätningar Antaganden: - Beroende grupper - Data behöver inte vara normalfördelad Användning: - Jämföra medianer
38
Mann-Whitney U-test (Wilcoxon rank-sum test): Grupper, antaganden och användning
Grupper: 2 oberoende Antagande: - Oberoende grupper - Data behöver inte vara normalfördelade Användning: - Jämföra medianer
39
Kruskal - Wallis test: Grupper, antaganden och användning
Grupper: 3+ oberoende Antagande: - Oberoende grupper - Data behöver inte vara normalfördelad Användning: - Jämföra medianer
40
Fördelar med statistiska analyser baserade på median?
- Inte känsliga för outliers -> Påverkas endast av placeringen av värdena i mitten av datasetet -> Särskilt användbar vis asymetrisk fördelning - Användbar vid snedfördelad data -> Ger en mer representativ bild av det centrala värdet än medelvärdet
41
Nackdelar med statistiska analyser baserade på median?
- Mindre användbar vid normalfördelning -> Vid normalfördelning är median lika eller mycket nära varandra -> Onödigt att använda median då - Begränsad information -> Medianen är inte lika effektiv som medelvärdet när det gäller att få ut full information från data, särsklit vid symmetrisk fördelning
42
När ska man använda medelvärde vs. median?
Medelvärde: - Normalfördelad data -> t-test, ANOVA Median: - Snedfördelad data - Vid extremvärden - Om datan är ordinal -> Mann-Whitney U-test, Kruskal-Wallis test
43
Vad betyder det om data är normalfördelad?
- De flesta observationer ligger kring medelvärdet - Möjliggör beräkning av hur stor andeö av alla observationer som finns inom ett visst antal standardavvikelser från medelvärdet
44
Hur kan data vara fördelad?
- Symmetrisk fördelning -> Normalfördelad - Positiv snedfördelning - Negativ snedfördelning
45
Vad är statistisk styrka?
- Sannolikheten att korrekt förkasta nollhypotesen när den är falsk -> Upptäcke en verklig effekt om den finns - Ett mått på hur känsligt ett statistiskt test är
46
Faktorer som påverkar den statistiska styrkan?
- Effektstorlek - Provstorlek - Signifikansnivå (alfa) - Variabilitet i data - Testets design
47
Hur påverkar effektstorlek den statistiska styrkan?
- Ju större den verkliga effekten är, desto lättare är det att upptäcka den
48
Hur påverkar provstorlek (n) den statistiska styrkan?
- Ju större provstorlek, desto större chans att upptäcka en verklig effekt - Ett större urval ger mer pålitliga resultat och minskar risken får att missa effekt
49
Hur påverkar signifikansnivån (alfa) den statistiska styrkan?
- Om vi höjer tröskelvärdet för att förkasta H0 (ex. 0,1) ökar den statistiska styrkan eftersom vi har ett större intervall där H0 får stämma - Ökas tröskeln är dock risken att begå ett typ 1 fel (falskt positivt) större -> Innebär att man förkastar en sann H0 ----> - Vid alfa 0,05 där 6 personer "bekräftar" H0 är signifikansen för hög och H0 förkastas ej - Vid alfa 0,1 där 6 personer "bekräftar" H0 är signifikansen låg nog att förkasta H0 ----> Detta kan på det viset leda till en felaktig förkastning av H0
50
Hur påverkar variabilitet i data den statistiska styrkan?
- Om det finns mycket variabilitet i data, blir det svårare att upptäcka en effekt, vilket minskar styrkan
51
Hur påverkar testets design den statistiska styrkan?
- Olika typer av statistiska tester har olika nivåer av styrka beroende på hur de är utformade och vilken typ av data de använder
52
Vad innebär det om ett test har en hög statistisk styrka?
- Testet har en hög sannolikhet att korrekt identifiera en verklig effekt om den finns
53
Vad innebär det om ett test har en låg statistisk styrka?
- Testet har en högre risk att missa verkliga effekter och därmed dra felaktiga slutsatser -> Typ 2 fel (falskt negativa)
54
Typer av fel i hypotesprövningar?
Typ 1 fel: - Falskt positivt resultat - Förkastar H0 när den egentligen är sann - Detta sker om P-värdet är mindre än alfa men det verkliga resultatet inte visar en direkt skillnad Typ 2 fel: Falskt negativt resultat - Accepterar H0 när den egentligen är falsk -> Detta sker om P-värdet är större än alfa, men det verkliga resultatet visar en skillnad