Biostatistik 1 Flashcards
Vad handlar den här delkursen om?
* Sannolikheter – formalisera det vi ofta gör dagligen
* Exempelvis: hur stor är sannolikheten att man blir sjuk om man är utsatt för en viss exponering?
—->Ett redskap för att få fakta
—->Skilja åsikt från fakta
Ffa fokus på att känna till och förstå vanliga begrepp i vetenskapliga artiklar, samt använda olika verktyg för att göra enkla statistiska test
händer y pga x.
Skillnad mellan behandling A & B
vila på fakta
Varför statistik
- Statistik för kritiskt tänkande
- Ett redskap för att få fakta- siffror bra strukturer
- Siffrorna hjälper oss att förstå information och undvika att vi drar slutsatser som är osannolikt att de är korrekta (iundviker att dra slutsatser på felaktiga grunder)
________________________ - Strukturera och beskriva information/data
- testa med statistiska verktyg (olika statistiska tester) om det t ex finns skillnad mellan två olika behandlingar, dvs förklarande (jämför med epi1-anteckningarna om studier)
- Exempel: testa om två behandlingsmetoder skiljer sig åt (dvs om skillnaden vi ser i våra resultat/data inte troligen beror på slumpen) (om dem är statistiska signifikanta)
- Exempel: Se om det är rasskillnad mellan förekomst av diabetes hos katter (kanske jobba mer preventivt om en ras är mer drabbad, hålla den i normalvikt)
- Alltså: jämföra, testa
—->Redskap för att få ny kunskap
En egenskap vi studerar/ mäter kallas variabel - varierar i datasettet
variabel ex x & y
typer av data 2 stora grupper
De två stora grupperna av data är:
* Kvantitativa (siffror, mängdbestämning, blodsockernivå, längd, vikt ex)
respektive
* Kvalitativa (ex päls, hälsotillstånd (finns ingen skala))
Olika dataformat 4 olika:
- Diskret variabel= kvantitativ men antar bara vissa (ofta heltals)värden
Tex antal personer i en familj, antal mjölktänder (antingen har mna eller inte, man har inte en halv)
____________________________ - Kontinuerliga
tex kroppsvikt, kroppstemperatur
____________________________ - Dikotoma= binära = har två möjliga utfall (ja/nej variabel)
-dvs 1/0 (på dator- annars fattar den ingenting), tex sjuk ja/nej, kön är vanligtvis en binär variabel
_____________________________ - Kategorisk: (fler kategorier än 2)
-låg, mellan, hög (rankat): lågt, normalt, högt blodtryck
-blå, röd, grön (orankade): tex hundras Schäfer, Labrador, Pudel
Byta dataformat (kan man göra)
En kontinuerlig variabel kan alltid grupperas i två (diktoma, binära) eller fler grupper. Ibland fördelaktigt men innebär alltid att man förlorar lite information (inte säkert detta är så viktigt för den studie man genomför; det beror på fokus för studien) – man tappar information när man gör kategorier.
Exempel: registrerar blodtryck hos deltagare i studien. Väljer sedan att kategorisera data till lågt – normalt – högt blodtryck baserat på specificerade kriterier. (du förlorar dock exakta siffror på vad blodtrycket är om man kategoriserar det första man gör
Bra att skriva upp kontunuerliga skala- och utgå från det när man kan
Ex blodtryck- binär 0 (normal) och 1 (högt). Kategorisk 90, 140 (flera grupper)
__________________________
Alltid en fördel samla in data på en kontinuerlig skala först. och sedan skapa en klassificering efter detta för att se till att all info är insamlad
Vad betyder SD
- Standardavikelser = standard deviation = spridningsmått (ex lite spridning eller väldigt utspritt)
- Hur mycket data aviker från medelvärdet
korstabell
två eller fler variabler samvarierar
olika diagram 6 st
- Stolpdiagram – diskret variabel med begränsat antal värden: visar frekvens (bar chart) Kvantitativ- mätbar. En kategori, sitter inte ihop. bara helt antal. Diskret. 1 olycka sker och inte en halv)
________________________________________________ - Histogram – kontinuerliga variabler eller diskreta med många värden. Kvantitativ- mätbar. Det sitter ihop.
________________________________________________________ - Cirkeldiagram – kvalitativa variabler: ytan proportionell mot andelen (pie chart, tårtdiagram). Kvalitativa- bara kontaterar, ingen inbördes rangordning ex färg. Tårtbitar. se frekvenser
_____________________________________ - Stapeldiagram / med grupperade staplar – kvalitativa variabler: samma princip som cirkeldiagrammet (bar chart, stapeldiagram) Olika kategorier & en prototion inne
__________________________________________ - Stolpdiagram - kvalitativa. Ex antal som gillar olika saker, går inte att ranka. olika kategorier
_____________________________________________ - Linjediagram – kvalitativa eller kvantitativa: förändring över månader eller år
Presentera data
* Vi får enskilda variabelvärden i vårt urval av t ex patienter
* Vi behöver summera dessa värden
* Genomsnittsvärden
-medelvärde
-median- mitt punkten
* Symmetrisk fördelning: ________ ___ _______ ____
* Icke-symmetrisk fördelning (mer utspritt): _____ ___ ______ ___ ______
- Symmetrisk fördelning: medelvärde och median lika
- Icke-symmetrisk fördelning (mer utspritt): medelvärde och median inte lika
________________
allt man samlar in blir en datapunkt
Presentera data
* Förutom genomsnittsvärdet rapporterar man spridningsmått dvs hur mycket data varierar dvs sprider sig
* Standardavvikelsen (standard deviation=SD)
-för de flesta material ligger de flesta värdena inom intervallet
medelvärdet +/- 2 standardavvikelser
* Kvartilavstånd (på engelska interquartile range)
-för median används oftast 25e och 75e percentilen av data som
spridningsmått runt medianvärdet
ja
Vad är skillnad på standardavikelse och kvartilavstånd
standardavikelse - Medelvvärdet
kvartilavstånd- Median
Exempel kvartilavstånd
Kvartiler delar in materialet/data i fyra lika delar precis som kvartar på en timme.
Medianen är det mittersta värdet dvs den mittersta kvartilen – motsvarande halvtimmen vid jämförandet med klockan. Sedan har vi den undre och övre kvartilen: dessa motsvaras av 15 minuter respektive 45 minuter med analogen 1 timme.
Här har vi två klasser: 7a och 7b. Klass 7a har medianvärde 21, nedre kvartil 17.5, övre kvartil 23.5. För klass 7b är medianen mitt emellan 19 och 21 dvs 20, nedre kvartil 14 (medelvärdet mellan 13 och 15), och övre kvartil 22.5 (medelvärdet mellan 22 och 23).
Kom ihåg: när det är jämnt antal observationer tar man medelvärdet av de två mittersta observationerna!
Rapportering:
Klass 7a median 21, kvartilavstånd 17.5-23.5
Klass 7b median 20, kvartilavstånd 14-22.5
ja
När du ska beskriva data: Tänk på att medelvärdet ska vara meningsfullt!
Det går matematiskt att räkna fram medelvärde i de flesta dataset, men du måste avgöra om ett (1) medelvärde är det bästa eller om du har moln /kluster av data med kanske inga datapunkter/observationer mellan de två grupperna – då kan det vara mycket mer informativt och korrekt att redovisa ett medelvärde per grupp.
Bilden till höger visar massa datapunkter – när man tittar på dem ser man att det i stort rör sig om två grupper: en med datavärden mellan -2 och 1.8, och en med datavärden 2.2-7. Det går att räkna ut ett matematiskt medelvärde (som troligen blir runt 2) men det är inte så informativt för det finns nästan inga observationer runt värde 2. Så det är bättre att redovisa ett medelvärde per grupp!
ja
Utfallet styr vilken testmetod du kan använda vid statistiskt test
Vad är ”utfallet”?
Y är utfallet. unikt för studien. Kan vara positivt eller negativt