Biostatistik 3 Flashcards
Vad är ett samband?
- Beskriver att det finns ett förhållande mellan två variabler
- Kan vara positivt eller negativt
- Innebär inte att det finns ett orsakssamband!
Vad är en korrelation?
- Statistiskt mått som beskriver styrkan och riktningen av ett linjärt samband mellan två variabler
-> Visar om det är ett positivt eller negativt samband - Om vi använder korrelationskoefficienten kan vi mäta hur starkt hullpoängen och vikten är relaterade till varandra i behandling A och kontrollgruppen
Skillnad mellan samband och korrelation?
Samband:
- Allmänt förhållande mellan variabler
- Kan vara linjärt eller icke-linjärt
- Kan inkludera kausalitet eller icke-kausalitet
- Kan vara svårt att mäta exakt
-> Ofta kvalitativt eller subjektivt
Korrelation:
- Specifikt linjärt samband mellan två variabler
- Måste vara linjärt
- Ej en indikator på kausalitet, bara relation
- Mätbart via korrelationskoefficienten
Vad används ett spridningsdiagram (scatter plot) för?
- Visualisera sambandet mellan två variabler
- Varje punkt på diagrammet representerar en observation där den ena variabeln (oberoende/förklarande) plottas på x-axeln och den andra variabeln (beroende/utfall) plottas på y-axeln
Olika typer av korrelation?
- Positiv korrelation
- Negativ korrelation
- Ingen korrelation
Vad innebär positiv korrelation?
- Observationsvärdena ligger samlade runt en tänkt linje med positiv lutning
-> Positiv korrelation mellan den beroende och oberoende variabeln - När en variabel ökar, tenderar den andra variabeln också att öka, och när en variabel minskar, tenderar den andra variabeln att minska
Vad innebär negativ korrelation?
- Observationsvärdena ligger samlade runt en tänkt linje med negativ lutning
-> Negativ korrelation mellan den beroende och oberoende variabeln - när en variabel ökar, tenderar den andra variabeln att minska, och vice versa
Vad innebär ingen korrelation?
- Observationsvärdena ligger utspridda och följer ingen linje
->Ingen korrelation
Vad är Pearsons korrelationskoefficient (r eller p)?
- Mäter linjära förhållanden mellan två kvantitativa variabler
- r (stickprov)
- p (population
- Korrelation sträcker sig från -1 till +1
-> +1 (perfekt positiv linjär korrelation)
-> -1 (perfekt negativ linjär korrelation)
-> 0 (ingen korrelation)
Kriterier för Pearsons korrelationskoefficient?
- Båda variabler måste vara kontinuerliga
- Linjär trend
- Inga avvikande värden
- Värde mellan -1 och +1
Vad är Spearmans (rang) koefficient?
- Icke-parametrisk metod
-> Kräver ingen normalfördelning - Om x och y inte uppfyller föregående kriterier
- Jämför rangordning mellan x och y
- Minskar betydelsen av ev. avvikande värden
Hur kan man göra en visuell bedömning och varför?
- Spridningsdiagram är bra för detta
- Viktig eftersom själva korrelationskoefficienten inte karaktäriserar sambandet mellan variablerna
-> Sammanfattande mått och skall aldrig ersätta en visuell bedömning av relationen mellan x och y
Motsvarar stark korrelation, orsakssamband?
- Nej
- Vi vet inte vilken variabel som påverkar vilken
- Båda variabler kan påverkas av en tredje variabel som inte finns med i analysen
Vad är regression?
- Statistiska modeller som kan utvärdera fler variabler mot ett utfall
Vad tillåter regression oss att göra?
- Studera samband mellan y och flera x
- Studera hur starkt sambandet är mellan varje x och y
- Skapa en prediktionsmodell som baserat på information om x kan förutsäga y
När ska en använda korrelation vs. regression?
Korrelation:
- Visar om det är ett positivt/ negativt samband mellan de två variablerna
- Korrelation måste undersökas innan man kan använda linjär regression
Regression:
- Visar hur mycket en förändring av en variabel påverkar en anna
Olika typer av regressionsanalyser?
- Enkel linjär regression
- Multipel linjär regression
- Logistik regression
Vad är enkel linjär regression?
- Används när man har en beroende och oberoende variabel
- Modellen försöker hitta en rak linje som bäst beskriver sambandet mellan variablerna
När används multipel linjär regression?
- Används när det finns flera oberoende variabler
Vad är logistik regression?
- Används när den beroende variabeln är binär (icke-linjärt samband)
- Modellen försöker förutsäga sannolikheten för att ett visst utfall inträffar, snarare än ett exakt värde
Vad är en confounder?
- Förväxlingsfaktor
- En faktor som påverkar både exponeringen och utfallet
- Uppstår om en annan faktor än den studerade visar sig påverka utfallet
- Multipel regression används för att kontrollera confounding
Hur identifierar man förväxlingsfaktorer?
- Titta på sin data
-> Om man ser att det verkar vara fler i en viss subgrupp som får ett utfall - Rita ett diagram där man illustrerar variablernas samband
- Man kan i analysstadiet, genom olika analyser se om det finns confounding
-> Genom att analysera, med resp. utan förväxlingsfaktorn - Ser hur sambandet mellan exponering och utfall ändras när förväxlingsfaktorn läggs till