Biostatistik Flashcards

1
Q

Varför statistik?

A
  • Beskriva data
  • Testa t.ex. om två behandlingsmetoder skiljer sig åt (om skillnaden vi ser inte beror på slumpen).

Ex. se om det är rasskillnad mellan förekomst av Diabetes Mellitus hos katter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vilka dataformat är vanliga?

A
  • Kontinuerlig data = kroppsvikt, puls, AF etc.
  • Dikotoma data (binära) = 1/0, finns bara två variabler t.ex. ja/nej.
  • Kategoriska data = rankat (låg-hög variabel) eller icke rankat (röd, grön, blå)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad betyder normalfördelning?

A

En teoretisk statistisk modell för hur en kvantitativ variabel (numerisk) skulle kunna variera mellan olika individer i en population. Likformig kurva på båda sidor runt medelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

De vanligaste statistiska testerna utgår från att observationerna är oberoende. Vad innebär oberoende observationer?

A

Begreppet (statistiskt, stokastiskt) oberoende observationer innebär att varje ny observation, varje ny data, ska ge lika mycket information oavsett alla tidigare observationer – de ska alltså inte ’hänga ihop’.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Ge exempel på observationer som INTE är oberoende (dvs ÄR beroende).

A
  • Om man gör upprepade mätningar på samma individ. T.ex. blodtryck på samma hund flera gånger per dag.
  • Hierarkiska data. Att man gör en blodtrycksmätning på på valpar från samma tik. (Man kan anta att dessa är mer lika än blodtrycksmätning på valpar från vitt skilda tikar.)
  • Personpåverkan. Ibland kan personer som hanterar/samlar/analyserar prov förorsaka statistiskt beroende mellan observationer. Om så är fallet är två observationer från samma person mer lika än två prov i allmänhet.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Kontinuerlig data behöver inte vara normalfördelad. Det kan vara en olikformad kurva på båda sidor runt medelvärdet. Vad innebär det? Ge två exempel på snedfördelad data.

A

Snedfördelad data är datamaterial där medelvärde och median skiljer sig markant åt.

  • Negativt skev (vänstersvans)
  • Positivt skev (högersvans)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

För att jämföra två oberoende gruppers medelvärde vid normalfördelning, kan man använda ett statistiskt test, vilket?

A

Student’s t-test eller t-test.

(Förutsätter observationen är oberoende, vilket brukar vara grundantagandet vid statistiska analyser).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

För att jämföra två gruppers medelvärde vid snedfördelning (icke-normalfördelning), kan man använda statiska test, vilka?

A

T.ex. Mann Witney U test eller Wilcoxon Signed Rank test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Om två observationer hänger ihop (är beroende), t.ex. om man har data på före och efter behandling inom samma individ, kan man INTE använda Student’s t-test. Vilket test använder man istället?

A

Parat test.

t.ex. parat t-test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Om både utfall och riskfaktor (determinent) är 1/0 använder man istället andra test.
Ex: jämföra proportion tikar med inkontinens i två grupper - kastrerade respektive intakta.
Ge exempel på statistiska tester som är lämpliga här.

A
  • Fisher’s exact test (för mindre datamängd)

- Chi-squaired test/chi2-test (större datamängd)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Temperatur postop på katt.

Vilken typ av variabel?

A

Kontinuerlig data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Katter som tillfrisknat eller inte, efter akut gastroenterit.
Vilken typ av data?

A

Binära (dikotoma) data, 1/0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Åldersgrupper nyfödda föl: 0-1 mån, 1-3 mån, 3-6 mån, 6-12 mån.
Vilken typ av data?

A

Kategorisk, rankad data (yngre till äldre).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vilken är en vanlig förutsättning för statistiska test?

A

Normalfördelning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

När används Student’s t-test?

A

Normalfördelade oberoende kontinuerliga data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

När används chi-squaired test?

A

Jämföra proportioner mellan två grupper. Vid större datamängd.

17
Q

Vad innebär medelvärde och hur beräknar man det?

A

Ett genomsnittsmått för kvantitativa variabler (numeriska).
Beräknas genom att summera samtliga observationer och dividerar med antalet.

(Kallas även aritmetiska medelvärdet)

18
Q

Vad innebär medianvärde?

A

Ett genomsnittsmått som är mittvärdet för en variabel (dvs hälften av av alla variabelvärden är mindre eller lika med medianen).

19
Q

Vad är standardavvikelse?

A

Mått på genomsnittlig avvikelse från medelvärdet.

20
Q

Vad är en variabel?

A

En uppgift som kan variera mellan olika individer i en undersökning.

21
Q

Vad innebär konfidensintervall?

A

Den statistiska felmarginalen.

Konfidensintervall tar inte hänsyn till systemiska fel, utan enbart den statistiska osäkerheten (det slumpmässiga felet.

22
Q

Vad innebär proportion?

A

Andel

23
Q

Vad är ett punktestimat?

A

Medelvärde, punktestimat. Kan vara medelvärde, median, eller beräkningar av odds ratio.

24
Q

Vilket är huvudsyftet med att studera ett utval av individer?

A

Att kunna dra slutsatser om en verklig eller tänkt, imaginär population.

25
Q

Vad är konfidensintervall?

A

Den statistiska felmarginalen.

Som alltid finns när man estimerar utfall från en urvalsgrupp till en målpopulation

26
Q

Vad menas med att konfidensintervallet ligger på 95%?

A

Att det är 95% sannolikhet att alla variabler i en population kommer hamna i konfidensintervallet. 5% kommer avvika och hamna utanför på vardera sida normalfördelningen.

I praktiken innebär detta att av 20 stickprov, ur samma population, kommer 19 hamna inom konfidensintervallet.

27
Q

Vilket konfidensintervall är mest precist, ett på 95% eller ett på 99%?

A

Ju högre procent (bredare kurva) desto säkrare. MEN ju högre procent desto MINDRE precist.

28
Q

Vad påverkar konfidensintervallets bredd?

A

Variationen i populationen man vill undersöka samt urvalsstorleken. Vanligast är dock att man använder 95% CI.

29
Q

Vad innebär incidens?

A

Vilka som insjuknar i en sjukdom under en viss tidsperiod.

30
Q

Vad innebär prevalens?

A

Alla som är sjuka under en viss tidsperiod.

31
Q

Vilka faktorer påverkar prevalensen?

A
Inflödet av nya sjukdomsfall
Sjukdomsdurationen
Ev. utflyttning
Behandlingsbarhet
Överlevnad
32
Q

Vad är en korstabell (two-by-two table)?

A

Ett sätt att ställa upp data.
Om vi har en riskfaktor som är vår exponering (exponerad: ja/nej)
Om vi har en sjukdom (frisk/sjuk).