Grundläggande biostatistiska begrepp Flashcards

Question 1

Q

Statistik

Answer

A

Insamling, utvärdering, analys och presentation av data/information

Question 2

Q

Biostatistik

Answer

A

Tillämpning av statistik inom det biologiska området

Question 3

Q

Huvudgrupper av datavariabler

Answer

A

Kvantitativ data - numeriska värden.

Kvalitativ data - subgrupper eller indelningar av data som inte är numerisk i grunden

Question 4

Q

Varför behövs statistik?

Answer

A

Kunna dra slutsatser från mindre population för att applicera för hela populationen med en viss procent säkerhet
Undvika åsikter/tryckande som grund för beslut
Hjälper till att beräkna hur mycket data du behöver samla in, samla aldrig in mer data än som behövs (etik)
Hjälper till att förstå och tolka insamlad data
Besvara forskningsfrågan, hypotesen
Får belägg och grund för uttalande

Question 5

Q

Individ/Fall

Answer

A

Undersökningsobjekt

Question 6

Q

Population

Answer

A

Alla individer/fall som formar grupper som vill studeras

Question 7

Q

Urval

Answer

A

Strickprov, en spegling av populationen

Question 8

Q

Variabel

Answer

A

Faktor som studeras inom kvantitativ forskning

Question 9

Q

Totalundersökning

Answer

A

Alla i populationen undersöks

Question 10

Q

Interferensstatistik

Answer

A

Bygger på sannolikhet.
Drar slutsatser för en hel population utifrån studie gjord på ett urval av populationen.
Betyder att vi inte vet helt säkert och därför behöver beskriva grad av osäkerhet (p-värde)

Question 11

Q

Variabelnivåer

Answer

A

Nominalskala - klassificering
Ordinalskala - rangordning
Intervallskala - finns given ordning och differens, men ingen given nollpunkt
Kvotskala - finns given ordning, differens och absolut nollpunkt

Question 12

Q

Hypotesprövning

Answer

A

Rimligheten i ett antagande (H0, finns ingen skillnad) prövas mot en alternativ hypotes/mothypotes (HI, finns skillnad)
Vid den statistiska analysen testas normalt om nollhypotesen (H0) kan förkastas
P-värdet ger “risken” att dra felaktiga slutsatser när H0 förkastas

Question 13

Q

Olika systematiska fel vid hypotesprövning

Answer

A

Typ I-fel - Förkastar H0 fast den är sann, hittar en skillnad som inte finns. Regleras genom att höja signifikansnivån.
Typ II-fel - H0 accepteras fastän den är falsk, missar en skillnad som faktiskt finns. Detta kan bero på stickprovsstorlek, effektstorlek och signifikansnivå

Question 14

Q

P-värde

Answer

A

Ett tal mellan 0-1 som anger hur sannolikt resultatet vi fått är, om nollhypotesen är sann. Vi behöver låga p-värden för att ha hög sannolikhet att kunna lita på resultatet

Question 15

Q

Felrisk

Answer

A

Felrisken som finns om det finns en skillnad mellan grupperna som beräknas genom p-värde. Är en typ av “säkerhetsnivå” dvs, hur säker kan jag vara på att det finns systematiska skillnader i mitt resultat?

Question 16

Q

Vad är felrisken om P = 0,08 och är resultatet signifikant om signifikansnivån är satt till p<0,05.

Answer

A

Felrisken blir 8% (vi kommer ha fel i 8 av 100 fall om H0 förkastas) och resultatet är inte signifikant.

Question 17

Q

Ange centralmåtten som finns och när de används

Answer

A

Medelvärde - används vid intervall och kvotskala och vid normalfördelad data
Median - används vid icke-normalfördelad data för ordinal, intervall och kvotskala
Typvärde (mest förekommande värdet) - kan användas vid alla variabelnivåer

Question 18

Q

Ange spridningsmåtten, vad de innebär och när de används

Answer

A

Standardavvikelse - anger mätvärdenas genomsnittliga avvikelse från medelvärdet, används med medelvärde
Variationsvidd - avstånd mellan min- och maxvärde, används ffa med median
Kvartilavstånd - nedre till övre kvartilen, ringar in det mittersta värdet, används med median och ibland medelvärde

Question 19

Q

Konfidensintervall

Answer

A

Mått på osäkerheten slumpen bidrar med när den bakomliggande populationens medelvärde skattas.
Beskriver graden av avvikelse i urvalet från det sanna medelvärdet i populationen.
Beskrivs vanligtvis som 95% CI vilket betyder att medelvärdet ska ligga inom dessa 95%.

Question 20

Q

När förekommer konfidensintervall?

Answer

A

Används vid prevalensberäkning, medelvärden, relativa risker och oddskvoter

Question 21

Q

Normalfördelningskurva

Answer

A

En kurva som beskriver fördelningen av värden/variabler.

Question 22

Q

Test för normalfördelning

Answer

A

Shapiro-Wilk

Question 23

Q

När är data icke-normalfördelad?

Answer

A

Då kurvan drar mer åt ena håller för att datan är ojämn fördelad inom materialet

Question 24

Q

Shapiro-Wilk

Answer

A

Testar om variabeln är normalfördelad vid observationer under 50. Beräknar ett p-värde. P-värdet ska vara >0,05 för att vara normalfördelat.

Question 25

Q

Parametrisk statistik

Answer

A

Används vid kvantitativa datavariabler och normalfördelad data.

Beräknar parametrar, ex. medelvärde och standardavvikelse

Question 26

Q

Icke-parametrisk statistik

Answer

A

Används vid kvalitativa datavariabler och vid icke-normalfördelad data.

Utgår från rangordning och median när data bearbetas.

Question 27

Q

Sensitivitet

Answer

A

Andel av de verkligt sjuka som metoden upptäcker (sant positiva)

Beräknas genom alla sant positiva/alla som har sjukdomen

Question 28

Q

Specificitet

Answer

A

Andelen friska som metoden anger som friska (sant negativa)

Beräknas genom sant negativa/alla negativa