statistik 3: korrelationer Flashcards
vad är korrelation
linjärt samband mellan två variabler, relation, följsamhet
- INTE KAUSALT SAMBAND
korr.koeff
Korrelationsanalysen ger en korrelationskoefficienten. (r/rho/tau - beror lite på vilken analysmetod som används hur man benämner koeff.)
Värdet är alltid inom intervallet -1 - 1. För en bra korrelation ska man ha värden så nära -1 eller så nära +1 som möjligt, dvs ytterligheterna
olika typer av korrelationer (+-0)
positiv korrelation: korrelationskoeff > 0
negativ korrelation: korrelationskoef<0
ej korrelation - inget linjärt samband, man kan inte uttala sig att det finns relation mellan variablerna. Dessa korrelationskoeff ligger runt siffran 0 i detta fall.
2 korrelationsanalyser
pearson
- Man ska ha två kvantitativa variabler, båda normalfördelade!!
0.7-1: , -1- (-0.7)
spearman:
- gäller för icke-NF kvant. variabler eller kval. variabler
- 1- (-0.3), 0.3-1.
(hur man värderar en korrelation beror lite på vilken område man studerar)
linjär regression
en multivariat analys med flera variabler
krav för att få göra regression
Y-variabeln: är kvant och NF
X: kvant och NF eller kval med diktotom (ja/nej)
- kan man inte uppfylla kraven får man göra logistiska regressioner
vad göra inför en linjär regression?
- välj ut Y-variabeln
- korrelation inför en regression
- gör en korr. analys för att hitta de x-variabler som korrelerar till y, då vet vi vilka x-variabler som är lämpliga att göra regression med
- kolla kolinearitet (korrelation mellan x). Detta kan påverka utfallet av regressionen. Det man kan göra om kolinearitet är att - slå ihop x-variabler med kolinearitet via matemat. formler
- gör antal regressioner och uteslut x-variabler med kolinearitet
steg att kunna vid regression
- titta på korrelation mellan y och varje x utefter värden som anses okej för spearman eller pearson
- titta på kolinearitet mellan x
- —————————————————————————— - är reg. signifikant (både hela regressionen och enskilda x-variabler). Alla x som ingår ska vara sig, om inte måste man göra om regressionen men just denna variabel
- kolla även att konstanten är sig (linjen där reg. skär y-axeln) - tolka regressionstabellen
- hur stor är förklaringsgraden (R^2) - tolka b-värdet
- tolka beta-värdet: rangordning av x utifrån påverkan på y-variabeln. titta på den råa siffran för att undersöka inbördes förhållanden mellan x
förklaringsgrad
berättar hur mycket våra x-variabler förklarar vår y-variabel. Det är ett procentmått som varierar mellan 0-100, vad man vill ha för storlek/grad hör ihop med syfte av regressionen.
- Ska man hitta bästa förklaringsmodellen (koppling mellan riskfaktor och diagnos) vill man ha en hög förklaringsgrad etc.
- Är syftet att påvisa att x-variabler inte alls påverkar y-variabeln, ja då vill vi ha så låg förklaringsgrad som möjligt.
b-värdet
används för att predicera ett y-värde utifrån x, för en enskild individ enligt regressionsekvationen.
kan användas för att beräkna y
från övningsexempel med regressioner - hur ska man arbeta strategiskt med regressioner?
- förklaringsgrad för regression
- signifikans av regressionen
- kontrollera om konstanten är signifikant
- är ingående x-variabler konstanta?
→ OM regressioner faller bort, välj den mest högst förklaringsgrad (R^2)