Biostatistik 1 Flashcards

1
Q

Vad handlar den här delkursen om?
* Sannolikheter – formalisera det vi ofta gör dagligen
* Exempelvis: hur stor är sannolikheten att man blir sjuk om man är utsatt för en viss exponering?
—->Ett redskap för att få fakta
—->Skilja åsikt från fakta
Ffa fokus på att känna till och förstå vanliga begrepp i vetenskapliga artiklar, samt använda olika verktyg för att göra enkla statistiska test

A

händer y pga x.
Skillnad mellan behandling A & B
vila på fakta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Varför statistik

A
  • Statistik för kritiskt tänkande
  • Ett redskap för att få fakta- siffror bra strukturer
  • Siffrorna hjälper oss att förstå information och undvika att vi drar slutsatser som är osannolikt att de är korrekta (iundviker att dra slutsatser på felaktiga grunder)
    ________________________
  • Strukturera och beskriva information/data
  • testa med statistiska verktyg (olika statistiska tester) om det t ex finns skillnad mellan två olika behandlingar, dvs förklarande (jämför med epi1-anteckningarna om studier)
  • Exempel: testa om två behandlingsmetoder skiljer sig åt (dvs om skillnaden vi ser i våra resultat/data inte troligen beror på slumpen) (om dem är statistiska signifikanta)
  • Exempel: Se om det är rasskillnad mellan förekomst av diabetes hos katter (kanske jobba mer preventivt om en ras är mer drabbad, hålla den i normalvikt)
  • Alltså: jämföra, testa
    —->Redskap för att få ny kunskap
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

En egenskap vi studerar/ mäter kallas variabel - varierar i datasettet

A

variabel ex x & y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

typer av data 2 stora grupper

A

De två stora grupperna av data är:
* Kvantitativa (siffror, mängdbestämning, blodsockernivå, längd, vikt ex)
respektive
* Kvalitativa (ex päls, hälsotillstånd (finns ingen skala))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Olika dataformat 4 olika:

A
  • Diskret variabel= kvantitativ men antar bara vissa (ofta heltals)värden
    Tex antal personer i en familj, antal mjölktänder (antingen har mna eller inte, man har inte en halv)
    ____________________________
  • Kontinuerliga
    tex kroppsvikt, kroppstemperatur
    ____________________________
  • Dikotoma= binära = har två möjliga utfall (ja/nej variabel)
    -dvs 1/0 (på dator- annars fattar den ingenting), tex sjuk ja/nej, kön är vanligtvis en binär variabel
    _____________________________
  • Kategorisk: (fler kategorier än 2)
    -låg, mellan, hög (rankat): lågt, normalt, högt blodtryck
    -blå, röd, grön (orankade): tex hundras Schäfer, Labrador, Pudel
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Byta dataformat (kan man göra)
En kontinuerlig variabel kan alltid grupperas i två (diktoma, binära) eller fler grupper. Ibland fördelaktigt men innebär alltid att man förlorar lite information (inte säkert detta är så viktigt för den studie man genomför; det beror på fokus för studien) – man tappar information när man gör kategorier.
Exempel: registrerar blodtryck hos deltagare i studien. Väljer sedan att kategorisera data till lågt – normalt – högt blodtryck baserat på specificerade kriterier. (du förlorar dock exakta siffror på vad blodtrycket är om man kategoriserar det första man gör

A

Bra att skriva upp kontunuerliga skala- och utgå från det när man kan
Ex blodtryck- binär 0 (normal) och 1 (högt). Kategorisk 90, 140 (flera grupper)
__________________________
Alltid en fördel samla in data på en kontinuerlig skala först. och sedan skapa en klassificering efter detta för att se till att all info är insamlad

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad betyder SD

A
  • Standardavikelser = standard deviation = spridningsmått (ex lite spridning eller väldigt utspritt)
  • Hur mycket data aviker från medelvärdet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

korstabell

A

två eller fler variabler samvarierar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

olika diagram 6 st

A
  • Stolpdiagram – diskret variabel med begränsat antal värden: visar frekvens (bar chart) Kvantitativ- mätbar. En kategori, sitter inte ihop. bara helt antal. Diskret. 1 olycka sker och inte en halv)
    ________________________________________________
  • Histogram – kontinuerliga variabler eller diskreta med många värden. Kvantitativ- mätbar. Det sitter ihop.
    ________________________________________________________
  • Cirkeldiagram – kvalitativa variabler: ytan proportionell mot andelen (pie chart, tårtdiagram). Kvalitativa- bara kontaterar, ingen inbördes rangordning ex färg. Tårtbitar. se frekvenser
    _____________________________________
  • Stapeldiagram / med grupperade staplar – kvalitativa variabler: samma princip som cirkeldiagrammet (bar chart, stapeldiagram) Olika kategorier & en prototion inne
    __________________________________________
  • Stolpdiagram - kvalitativa. Ex antal som gillar olika saker, går inte att ranka. olika kategorier
    _____________________________________________
  • Linjediagram – kvalitativa eller kvantitativa: förändring över månader eller år
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Presentera data
* Vi får enskilda variabelvärden i vårt urval av t ex patienter
* Vi behöver summera dessa värden
* Genomsnittsvärden
-medelvärde
-median- mitt punkten
* Symmetrisk fördelning: ________ ___ _______ ____
* Icke-symmetrisk fördelning (mer utspritt): _____ ___ ______ ___ ______

A
  • Symmetrisk fördelning: medelvärde och median lika
  • Icke-symmetrisk fördelning (mer utspritt): medelvärde och median inte lika
    ________________
    allt man samlar in blir en datapunkt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Presentera data
* Förutom genomsnittsvärdet rapporterar man spridningsmått dvs hur mycket data varierar dvs sprider sig
* Standardavvikelsen (standard deviation=SD)
-för de flesta material ligger de flesta värdena inom intervallet
medelvärdet +/- 2 standardavvikelser
* Kvartilavstånd (på engelska interquartile range)
-för median används oftast 25e och 75e percentilen av data som
spridningsmått runt medianvärdet

A

ja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad är skillnad på standardavikelse och kvartilavstånd

A

standardavikelse - Medelvvärdet
kvartilavstånd- Median

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Exempel kvartilavstånd
Kvartiler delar in materialet/data i fyra lika delar precis som kvartar på en timme.
Medianen är det mittersta värdet dvs den mittersta kvartilen – motsvarande halvtimmen vid jämförandet med klockan. Sedan har vi den undre och övre kvartilen: dessa motsvaras av 15 minuter respektive 45 minuter med analogen 1 timme.
Här har vi två klasser: 7a och 7b. Klass 7a har medianvärde 21, nedre kvartil 17.5, övre kvartil 23.5. För klass 7b är medianen mitt emellan 19 och 21 dvs 20, nedre kvartil 14 (medelvärdet mellan 13 och 15), och övre kvartil 22.5 (medelvärdet mellan 22 och 23).
Kom ihåg: när det är jämnt antal observationer tar man medelvärdet av de två mittersta observationerna!
Rapportering:
Klass 7a median 21, kvartilavstånd 17.5-23.5
Klass 7b median 20, kvartilavstånd 14-22.5

A

ja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

När du ska beskriva data: Tänk på att medelvärdet ska vara meningsfullt!
Det går matematiskt att räkna fram medelvärde i de flesta dataset, men du måste avgöra om ett (1) medelvärde är det bästa eller om du har moln /kluster av data med kanske inga datapunkter/observationer mellan de två grupperna – då kan det vara mycket mer informativt och korrekt att redovisa ett medelvärde per grupp.
Bilden till höger visar massa datapunkter – när man tittar på dem ser man att det i stort rör sig om två grupper: en med datavärden mellan -2 och 1.8, och en med datavärden 2.2-7. Det går att räkna ut ett matematiskt medelvärde (som troligen blir runt 2) men det är inte så informativt för det finns nästan inga observationer runt värde 2. Så det är bättre att redovisa ett medelvärde per grupp!

A

ja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Utfallet styr vilken testmetod du kan använda vid statistiskt test
Vad är ”utfallet”?

A

Y är utfallet. unikt för studien. Kan vara positivt eller negativt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Utfallet är det man undersöker i studien, tex kroppsvikt hos labradorer, och det kan vara en sjukdom (som diabetes hos katt) eller något positivt (som hur ofta någon är glad eller skriver godkänt på en tenta), eller annan negativ händelse (som död).
Notera att den variabel som kallas utfallet i en undersökning inte behöver vara ett utfall i andra undersökningar.
Exempel: vi undersöker risken för hjärtinfarkt om man är rökare. Hjärtinfarkten är utfallet vi studerar här.
Om vi studerar sambandet mellan hjärtinfarkt och ålder vid döden?

A

så är död utfallet

17
Q

Utfallet styr vilken testmetod du kan använda vid statistiskt test. 3 *

A
  • Kontinuerlig skala: medelvärde eller medianvärde för att beskriva ”mitten” av datapunkterna, dvs centralmått. Ex: jämföra medelblodtryck för människor som får olika behandling
  • 1/0-variabel: proportion eller räknar antalet händelser. Ex jämföra proportionen katter som blir symptomfria av gastroenteritbehandling
  • Grupper/kategorier: antal eller proportion i varje grupp
18
Q

___________ ________har en jämn kurva.
En ojämn kurva har “icke normal fördelning”

A

kontinuerlig data har en jämn kurva.
En ojämn kurva har “icke normal fördelning”

19
Q

Oberoende observationer

A

De vanligaste statistiska testerna utgår från att observationerna är oberoende (ska inte hänga ihop)
Begreppet (statistiskt, stokastiskt) oberoende observationer innebär att varje ny observation, varje ny data, ska ge lika mycket information oavsett alla tidigare observationer – de ska alltså inte ’hänga ihop’. Enklast att förstå vad det faktiskt innebär är att ge exempel på när det rimligen inte är oberoende utan beroende:

20
Q

Exempel BEROENDE observationer

A
  • Om man gör många mätningar per individ (tidsserier) så används metoden repeated measurements=upprepade mätningar på samma individ. Man mäter då t ex blodtryck flera gånger per dag på varje hund.
  • Hierarkiska data: Om man undersöker valpar från olika tikar från en hunduppfödare man kan anta att två valpar från samma tik är mer lika än två valpar från två olika tikar
    __________________________________________
  • Personpåverkan: Ibland kan personer som hanterar/samlar/analyserar prov förorsaka statistiskt beroende mellan observationer: Om så är fallet är två observationer från samma person mer lika än två prov i allmänhet