Biostatistik Flashcards

1
Q

Vad bör finnas med i en statistisk analysplan?

A
  • Vilka grupper och vilka utfall ska jämföras med varandra?
  • Vilka statistiska metoder ska användas?
  • Hur saknade eller kraftigt avvikande värden ska hanteras?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad innebär målpopulation?

A

Målpopulation: Den större populationen utanför undersökningen som man vill kunna dra slutsatser om

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vilka modeller använder man oftast för beskrivande statistik?

A

Lägesmått/ centralmått (medianvärde, medelvärde och typvärde)

Spridningsmått (standardavvikelse och varians)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vilka modeller använder man oftast för analytisk statistik?

A

Jämföra (konfidensintervall)

Sambandsanalys (regressionsanalys), likhet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Nämn några urvalsmetoder:

A
  • Obundet slumpmässigt urval (OSU): Varje enhet i populationen är lika sannolik att bli dragen
  • Stratifierat urval: Uppdelning i olika grupper och utifrån det görs ett slumpmässigt urval
    • T.ex boende i olika kommuner
  • Systematiska urval: System för urval
    • T.ex. var 5:e person i en klass
  • Klusterurval: **Slumpmässiga urval görs från redan definierade grupper
    • T.ex boende i olika kommuner → personer från kommunerna
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad kan urvalets storlek bero på?

A

Vilken minsta skillnad mellan behandlingseffekt man vill uppnå, hur stor variationen kommer vara, vilken statistisk styrka som krävs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad innebär statistisk felmarginal?

A

Slumpmässigt fel i resultat som beror på individuell variation i urvalet. Ju fler individer desto mindre statistisk osäkerhet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vilka systematiska fel (bias) är vanligast?

A
  1. Selektionsfel: inte representativt för målpopulationen
    • T.ex. icke slumpmässigt urval, bortfall
  2. Informationsfel: Felaktigheter i datainsamlingen
    • T.ex. felaktigt svar från appartur, felaktig rapportering (svarat fel på fråga i enkät)
  3. Förväxlingseffekter: Bristande jämförbarhet i de grupper som undersökts
    • T.ex. stor skillnad i utgångsläge mellan grupperna - inte jämförbara
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad innebär kvantitativa variabler (numeriska variabler)?

A

Kvantitativa variabler samlar in en rad data (siffror) och sammanfattar denna genom tex medel- eller medianvärde. Delas upp i diskreta variabler där de finns en begränsning i antalet värden och i kontinuerliga variabler där de finns obegränsat antal värden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad innebär kvalitativa/ kategoriska variabler?

A

Här delar man inte datan i olika grupper/ klasser. Kan ske tex genom rangordnad (låg, medel, hög) eller icke- rangordnat (ex olika raser). Kan även vara binära (diktoma) variabler där man har två möjliga utfall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hur sammanställer man kvantitativa variabler?

A

Medel/ medianvärde. Ofta använder man stolpdiagram eller histogram

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hur sammanställer man kvalitativa variabler?

A

Här använder man sekvens eller procent, ofta cirkeldiagram eller liknande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vilka skalor kan kvantitativa variabler mätas på?

A

Intervallskala: Rangordnade, specifika avstånd, ingen given nollpunkt

  • T.ex. temperatur-(⁰C)
  • Kvotskala: Rangordnade, specifika avstånd, en given nollpunkt
    • T.ex. mankhöjd
  • Absolutskala: Rangordnade, specifika avstånd, en given nollpunkt och måttenhet
    • T.ex antal patienter
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vilka skalor kan kvalitativa variabler mätas på?

A
  • Nominalskala: Saknar rangordning
    • T.ex. kön, behandlingsgrupp
  • Ordinalskala: Rangordnade men avstånden kan inte avgöras
    • T.ex. smärtskala (låg-måttlig-hög)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad betyder diktomisera?

A

Att man skapar binära variabler från kvantitativa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad innebär centralmått?

A

Ett genomsnittsmått. Kan mätas genom medelvärde, medianvärde eller typvärde (vanligaste värdet)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad innebär spridningsmått?

A

Hur spridda värdena är från centrum.

  1. Standardavvikelse: Mått på genomsnittlig avvikelse från medelvärdet
  2. Variationsvidd: (Min och max) Lägsta och högsta värdet; variansen mellan min-max: variationsvidd
  3. Kvartiler och percentiler: Gränsen som klyver datamaterialet i bestämda proportioner
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vilket val av genomsnitts- och spridningsmått bör man ta till symmetrisk fördelad data?

A

Medelvärde och standardavvikelse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vilket val av genomsnitts- och spridningsmått bör man ta till asymmetrisk data?

A

Median och kvartiler eller percentiler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Vad innebär standardavvikelse?

A

SD = standard deviation = standardavvikelse- ett mått på de genomsnittliga avvikelsen från medelvärdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vad innebär variationskoefficient?

A

Variationskoefficienten uttrycker standardavvikelsen som procentandelar av medelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vad innebär kvartiler?

A

Kvartiler delar in de totala mätvärdena i 2 delar, där median/medelvärdet är i mitten, den övre kvartilen är i mitten av den övre hälften och den undre kvartilen är i mitten av den undre hälften.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vad innebär normalfördelning?

A

Observationer som ligger symmetriskt kring medelvärdet, alltså att flest värden ligger i mitten kring medelvärdet och sedan avtar ju längre ifrån vi kommer medelvärdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Vad innebär oberoende observationer?

A

Oberoende observationer- varje ny observation ger lika mycket information oberoende av tidigare observationer (ex olika patientera blodtryck)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Vad innebär beroende observationer?

A

Beroende observationer- upprepade mätningar som är beroende av varandra (ex samma patients blodtryck)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Vad innebär parametriska test och hur mäter man de?

A

Parametriska test är stora undersökningar som jämför medelvärdet i kvantitativa prov- eller mätresultat. Här använder man normalfördelade data och students t-test som undersöker hur en grupps referensvärde skiljer sig från en annan grupps referensvärde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Vad innebär icke- parametriska test och hur mäter man det?

A

Icke-parametriska test är små undersökningar med kraftigt avvikande värden där man jämför medianvärdet på icke- normalfördelade data. Här kan man använda sig av Mann Whitney U test ex

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Vad är ett chi- squared test?

A

Ett chi- squared test jämför proportioner mellan två grupper

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Vad är ett punktestimat?

A

Ett tal som används för att estimera ett tal, ex medelvärdet i en population eller fördelning. I beskrivande studier är de ofta median- eller medelvärde och i analytiska studier är det ofta odds ratio eller risk ratio

30
Q

Vad är standardfel?

A

En uppskattning av hur osäkert det uträknade medelvärdet som man har i studien är. Så studie populationer har gett oss ett medelvärde, sen säger SE hur osäkert det är att det här medelvärdet stämmer med målpopulationen. Sen med hjälp av SE tar gör man en konfidensintervall som säger att det ”riktiga” medelvärdet ligger innanför kondisensintervallet

31
Q

Vad är konfidensintervall?

A

Ett intervall där man med en viss konfidensgrad (ofta 95%) kan säga att det verkliga värdet ligger i. 95% av fallen borde alltså hamna inom de givna konfidensintervallet

32
Q

Vad är ett referensintervall?

A

Ett intervall där vi förväntar oss att friska individer hamnar när vi gör en analys av en hälsomarkör.

33
Q

Vad är guldstandard?

A

Ett test eller en metod som man vet kan mäta det man vill mäta korrekt. Det bästa sättet att mäta det som ska mätas.

34
Q

Vad är t-fördelning?

A

För små stickprov blir KI för snäva och då används T-fördelningen där frihetsgraden bestämer konstanten c.

35
Q

Vilken formel har konfidensintervall i stora undersökningar?

A

Medelvärde+_ 1.96 x medelfel = KI

36
Q

Vad bygger parametriska test på?

A

Antaganden om hur målpopulationen ser ut

37
Q

Vad bygger icke-parametriska test på?

A

Har inga antaganden om målpopulation utan används till mindre statistiska test av ex medianer

38
Q

Nämn några olika sorters medelvärdesjämförelser:

A
  • En grupp: t-test av ett medelvärde
  • Parade mätningar: Parat t-test
  • Två eller fler oberoende grupper: Vanligt t-test, variansanalys
39
Q

Vilken typ av data och vilket statistiskt test vill man använda vid parade mätningar?

A

Beroende data och parat t-test

40
Q

Vad är parat t-test?

A

Matchad patient- kontrollpar mot varandra. Används för parade differenser som är normalfördelade och många.

41
Q

Vad är en variationsanalys?

A

Här har man fler än två oberoende grupper. Den totala variationen delas in i två grupper. Utfallet bör vara normalfördelat och ha liknande SD

42
Q

När vill man ha ett test med hög sensitivitet?

A

När man har en allvarlig men behanlingsbar sjukdom, för att utesluta sjukdomar mm

43
Q

När vill man ha test med hög specificitet?

A

Bekräfta misstanke om sjukdom, stora konsekvenser att felklassa frisk som sjuk

44
Q

Vad betyder sensitivitet och specificitet?

A
  • Sensitivitet: sannolikheten att testet ger ett positivt resultat för någon som haft sjukdomen
  • Specificitet: sannolikheten att testet ger ett negativt resultat för någon som inte haft sjukdomen
45
Q

Vad innebär positivt prediktivt värde?

A

Positivt prediktivt värde: uttrycker sannolikheten att det positiva testresultatet är korrekt. Sannolikheten att en patient som testat friskt egentligen är sjuk

46
Q

Vad innebär negativt prediktivt värde?

A

Negativt prediktivt värde: beskriver chansen att ett negativt resultat är riktigt. Sannolikheten att en patient som testat sjukt egentligen är frisk

47
Q

Vad innebär falskt positiva/ falskt negativa?

A
  • Falskt positiva: ger ett positivt utslag där de egentligen ska vara negativt
  • Falskt negativa: ger ett negativt utslag där de egentligen ska vara positivt
48
Q

Vad är p-värdet?

A

P-värde: p- värde är ett mått på hur sannolikt det är att observationen är en slump. Är en procentsiffra som anger hur sannolikt det är att nollhypotesen (den som säger att det inte är någon skillnad) är sann. Som regel använder man en gräns på 5% för att avgöra om fynd är statistiskt signifikanta. Om p-värdet är p<0.05 (lägre än 5%) är det en mycket liten sannolikhet att det bara är en slump och nollhypotesen är motbevisad. Är p≥0.05 kan observationen vara en slump och nollhypotesen behålls.

49
Q

Vad är en nollhypotes?

A

Nollhypotes: nollhypotesen är den hypotes som säger att det inte finns någon skillnad eller korrelation mellan de variabler man undersöker. Man utgår från nollhypotesen och försöker bevisa att nollhypotesen är felaktig.

50
Q

Vad är en mothypotes?

A

Mothypotes: en alternativ hypotes som kan användas om nollhypotesen förkastas

51
Q

Vad innebär statistisk signifikans?

A

Statistisk signifikans: en term som används för att beskriva hur sannolikt det är att en skillnad eller ett samband som observerats inte bara är en slump. När en skillnad eller ett samband är statistiskt signifikant kan man säga att skillnaden eller sambandet inte kan förklaras av slumpen, och därför är det sannolikt att skillnaden eller sambandet är verkligt.

52
Q

Vilka signifikansgränser anger man och vad är det?

A

Signifikansgräns: anger risken att felaktigt förkasta en nollhypotes

  • Typ I fel: man förkastar en sann nollhypotes- man tror för mycket på sitt arbete
  • Typ II fel: man behåller en felaktig nollhypotes- man tror inte tillräckligt på sitt arbete
53
Q

Vad påverkar en studies chans att få signifikanta resultat och låga p-värden?

A
  1. Urvalsstorleken
  2. Storleken på effekten
54
Q

När utförs medianjämförelser?

A

Genomförs då förutsättningar för t-test inte är uppfyllda (dvs. inte normalfördelad data och inga stora grupper)

55
Q

Nämn några medianjämförelser:

A

Medianjämförelser (icke-parametriska test) utförs för:

  • En grupp (Teckentest)
  • Parade mätningar (Teckentest, Wilcoxons teckenrangtest)
  • Två eller flera oberoende grupper (Mann-Whitney test eller Kruskal-Wallis test)
56
Q

Vad använder man t-test för?

A

Jämförelse av två normalfördelade populationer.

57
Q

Vad används chi- square test för?

A

Jämförelse mellan frekvenser och proportioner, för att analysera data på ordinal (ligger i ordning, kategorisk data)- eller nominal (svarsalternativen saknar rangordning) skala.

58
Q

Vilka begränsningar har t-test och chi-square test?

A

De tar bara hänsyn till en variabel i taget. Andra variabler måste hanteras genom att dela upp materialet (stratifiera)

59
Q

Vad innebär korrelation?

A

Korrelation undersöker sambandet mellan två eller fler variabler, och är ett mått på hur starkt detta samband är. Mäts i korrelationskoefficient. Används ofta till linjära samband. Korrelation visar om det är ett positivt/ negativt samband mellan de två variablerna

60
Q

Vad innebär regressionsanalys?

A

Regressionsanalysen studerar hur starkt sambandet mellan två eller fler variabler är (univarata eller multivarata). Här kan man även göra prediktioner. Regression visar hur en förändring av en variabel påverkar en annan variabel

61
Q

Nämn några exempel på regressionsanalyser:

A
  • Linjär regression (linear regression): Konternuerliga utfall. Förutsäger värdet på en variabel utifrån kunskapen om en annan.
  • Logistisk regression: Dikotoma utfall/binära/ja-nej
  • Överlevnadsanalys (survival analysis) – Cox regression: Tid till händelse (död)
62
Q

Vad är en confounder?

A

En faktor som påverkar både exponeringen och utfallet.

63
Q

Vad är multipel regression?

A

Används för att kontrollera för confounding

64
Q

Vad är confounding?

A

När en confounder påverkar variablerna olika och därmed orsakar oreda.

65
Q

Vad är associationsmått?

A

Jämförelse mellan exponerade och icke- exponerade grupper. Är RR och OR

66
Q

Vad är Relativ Risk?

A

Risk att något händer i en grupp jämfört med risken att något händer i en annan grupp.

67
Q

Vilken formel räknar man RR med?

A

RR=((a/a+b)/(c/c+d))

68
Q

Vad är oddskvot (OR)?

A

Här ser man om det är högre odds för exponering hos fallen A (exponerade sjuka), B (oexponerade sjuka) jämfört med exponeringen hos de friska (C exponerade friska, D oexponerade friska). Redovisas ofta i fall- kontrollstudier

69
Q

Hur räknar man ut OR?

A

OR= ((a/b) / (c/d))

70
Q

Vad gör ett spridningsdiagram?

A

Spridningsdiagram: ett spridningsdiagram ger oss en uppfattnign om det finns någon korrelation mellan X och Y