Grundläggande biostatistiska begrepp Flashcards

1
Q

Statistik

A

Insamling, utvärdering, analys och presentation av data/information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Biostatistik

A

Tillämpning av statistik inom det biologiska området

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Huvudgrupper av datavariabler

A

Kvantitativ data - numeriska värden.

Kvalitativ data - subgrupper eller indelningar av data som inte är numerisk i grunden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Varför behövs statistik?

A
  • Kunna dra slutsatser från mindre population för att applicera för hela populationen med en viss procent säkerhet
  • Undvika åsikter/tryckande som grund för beslut
  • Hjälper till att beräkna hur mycket data du behöver samla in, samla aldrig in mer data än som behövs (etik)
  • Hjälper till att förstå och tolka insamlad data
  • Besvara forskningsfrågan, hypotesen
  • Får belägg och grund för uttalande
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Individ/Fall

A

Undersökningsobjekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Population

A

Alla individer/fall som formar grupper som vill studeras

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Urval

A

Strickprov, en spegling av populationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Variabel

A

Faktor som studeras inom kvantitativ forskning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Totalundersökning

A

Alla i populationen undersöks

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Interferensstatistik

A

Bygger på sannolikhet.
Drar slutsatser för en hel population utifrån studie gjord på ett urval av populationen.
Betyder att vi inte vet helt säkert och därför behöver beskriva grad av osäkerhet (p-värde)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Variabelnivåer

A

Nominalskala - klassificering
Ordinalskala - rangordning
Intervallskala - finns given ordning och differens, men ingen given nollpunkt
Kvotskala - finns given ordning, differens och absolut nollpunkt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hypotesprövning

A
  • Rimligheten i ett antagande (H0, finns ingen skillnad) prövas mot en alternativ hypotes/mothypotes (HI, finns skillnad)
  • Vid den statistiska analysen testas normalt om nollhypotesen (H0) kan förkastas
  • P-värdet ger “risken” att dra felaktiga slutsatser när H0 förkastas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Olika systematiska fel vid hypotesprövning

A
  • Typ I-fel - Förkastar H0 fast den är sann, hittar en skillnad som inte finns. Regleras genom att höja signifikansnivån.
  • Typ II-fel - H0 accepteras fastän den är falsk, missar en skillnad som faktiskt finns. Detta kan bero på stickprovsstorlek, effektstorlek och signifikansnivå
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

P-värde

A

Ett tal mellan 0-1 som anger hur sannolikt resultatet vi fått är, om nollhypotesen är sann. Vi behöver låga p-värden för att ha hög sannolikhet att kunna lita på resultatet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Felrisk

A

Felrisken som finns om det finns en skillnad mellan grupperna som beräknas genom p-värde. Är en typ av “säkerhetsnivå” dvs, hur säker kan jag vara på att det finns systematiska skillnader i mitt resultat?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad är felrisken om P = 0,08 och är resultatet signifikant om signifikansnivån är satt till p<0,05.

A

Felrisken blir 8% (vi kommer ha fel i 8 av 100 fall om H0 förkastas) och resultatet är inte signifikant.

17
Q

Ange centralmåtten som finns och när de används

A
  • Medelvärde - används vid intervall och kvotskala och vid normalfördelad data
  • Median - används vid icke-normalfördelad data för ordinal, intervall och kvotskala
  • Typvärde (mest förekommande värdet) - kan användas vid alla variabelnivåer
18
Q

Ange spridningsmåtten, vad de innebär och när de används

A
  • Standardavvikelse - anger mätvärdenas genomsnittliga avvikelse från medelvärdet, används med medelvärde
  • Variationsvidd - avstånd mellan min- och maxvärde, används ffa med median
  • Kvartilavstånd - nedre till övre kvartilen, ringar in det mittersta värdet, används med median och ibland medelvärde
19
Q

Konfidensintervall

A

Mått på osäkerheten slumpen bidrar med när den bakomliggande populationens medelvärde skattas.
Beskriver graden av avvikelse i urvalet från det sanna medelvärdet i populationen.
Beskrivs vanligtvis som 95% CI vilket betyder att medelvärdet ska ligga inom dessa 95%.

20
Q

När förekommer konfidensintervall?

A

Används vid prevalensberäkning, medelvärden, relativa risker och oddskvoter

21
Q

Normalfördelningskurva

A

En kurva som beskriver fördelningen av värden/variabler.

22
Q

Test för normalfördelning

A

Shapiro-Wilk

23
Q

När är data icke-normalfördelad?

A

Då kurvan drar mer åt ena håller för att datan är ojämn fördelad inom materialet

24
Q

Shapiro-Wilk

A

Testar om variabeln är normalfördelad vid observationer under 50. Beräknar ett p-värde. P-värdet ska vara >0,05 för att vara normalfördelat.

25
Q

Parametrisk statistik

A

Används vid kvantitativa datavariabler och normalfördelad data.

Beräknar parametrar, ex. medelvärde och standardavvikelse

26
Q

Icke-parametrisk statistik

A

Används vid kvalitativa datavariabler och vid icke-normalfördelad data.

Utgår från rangordning och median när data bearbetas.

27
Q

Sensitivitet

A

Andel av de verkligt sjuka som metoden upptäcker (sant positiva)

Beräknas genom alla sant positiva/alla som har sjukdomen

28
Q

Specificitet

A

Andelen friska som metoden anger som friska (sant negativa)

Beräknas genom sant negativa/alla negativa