VF : Statistik 2 Flashcards
Vad används korrelation och regression till inom statistiken?
Korrelation och regression är statistiska analyser man använder för att påvisa samband mellan olika variabler. Linjärt samband!
Vad är korrelation?
Ett linjärt samband mellan två variabler = om ena variabeln ökar i värde så ökar även den andra i värde Kan inte uttala sig om kasulatet.
Vad säger korrelation om kausala samband?
Korrelation säger inte om kausala samband Dvs. vi vet inte om den ena orsakar den andra
Inom vilket intervall är korrelation?
-1 = r = 1 r= rho = tau kan används alla Datorn räknar ut r
Vad är en bra korrelation?
En bra korrelation ska vara nära ytterligheterna som möjligt: 1 eller -1 Olika gränser för olika metoder: Pearson: -0,7 och 0,7 Spearman: -0,3 och 0,3
Vilka korrelationsanalyser finns?
Pearson: - Kräver 2 kvantitativa variabler - Kräver normalfördelning på båda - 1 till -0,7 och 0,7 till 1 Spearman: - Resten av kombinationer - Fungerar för kvalitativ variabel - -1 till -0,3 och 0,3 till 1
Vad innebär regression?
En variabel (y, beroende) ska förklaras med hjälp av ett antal andra variabler (x, oberoende) Regression kan användas för att hitta riskfaktorer eller friskfaktorer KRAV: - y variabel är kvantiativ och normalfördelat -x varival kvantiativ och normalfördel och dikotom (bara två svar)
Hur gör man en korrelation inför regression?
- Hitta de x-variabler som hör ihop med y-variabeln. Detta genom t.ex. läst andra stuider, allmänt vedertaget eller nytt forskningområde. Detta kallas att göra en korrelationsanalays.
- Undersök de x-variabler som är valda i steg 1, om de hör ihop (alltså om det har samband mellan de olika x-värderna), detta kallas för en kolinearitet.
- kontrollera detta.
- Är konstanten signifikant? JA. (läs under ”constant”)
- Y = kx + m. (m är där linjen skär y-axeln).
- Är x-variablerna signifikanta? Alla utan 2.
- Minoritet blir signifikant trots utan hög korrelation.
- Är hela regressionen signifikant? JA (viktigaste p-värdet)
- Redovisas i undertexten.
hur kan korrelation se ut grafiskt?
två kvantitativa variabler med grafter som är linjära. en kvantitativ och en kvalitativ variabel - likt stabldiagram två kvalitativa variabler med punkter i ett rutnät.
ge ett exmepl på en tabell där Lön och utbildning och kön vissar enligt pearson och sperarman?
vad är förklaringsgrad? och även beta? även b-värden i tablellen nedan?
Beta = konstatera rangordningen på hur x-variabeln påverkar y-variabeln. Först påverkar utbildningsår mest.
Sedan påverkar kön mest.
B-värde: används för att predicera ett y-värde för en enskilad indiviet enligt regressionskvatinon. Kan där med se vilka x-värden man ska ha för att få ett högt y-värde. t.ex. att de är bättre att vara man än att vara kvinna i denna tabel. Även många utbildningsård och ej minoriet ger också hög lön.
(Adj.) R2 = Förklaringsgrad. Varierar från 0-100%. Hur stor del av y-variabel som kan förklaras av dessa x-variabler. Resterande procent har vi ingen aning om. Man vill ha hög förklaringsgrad om man t.ex. letar koppling mellan diagnos och riskfaktorer.