Multipel regression Flashcards
Vad innebär korrelation?
- Korrelation beskriver sambandet mellan två variabler
Vad är determinationskoefficienten r^2?
determinationskoefficienten r^2 beskriver STYRKAN i sabandet
Vilka antaganden måste gälla för att vi ska kunna göra korrelationsanalys?
- Homoskedasticitet
- Bivariat normalfördelning
Vad finns det för risker med att göra korrelationsanalys?
- Man måste vara observant för outliers
- Försiktig med att endast kika på en del av rangen
- Det kan finnas icke-linjära samband
- Det kan finnas en tredjevariabel som är orsaken till korrelationen
- Det är ofta svårt att säga någonting om kausaliteten på korrelationen
- Stickprovsstorleken påverkar storleken på effekten för korrelationen
Varför vill man göra en enkel regression?
- Regression är användbart för att göra prediktioner, dvs antaganden om hypotetiska fall
–> T.ex. vad blir BV när OV är X.
2.
Vad innebär regressionsekvationen?
- Den linje som bäst och med minst fel beskriver alla datapunkter
- y=b0+b1*x
–>bo= intercept/constant= BV när OB är minsta möjliga dvs 0
–> b1=slope=linjens lutning, korrelationekoefficienten?
Skillnad mellan enkel och multipel regression
ENKEL REGRESSION
–> 1 BV, 1 OV
–> Med utgångspunkt i information om X, vill vi uttala oss om Y.
–> y= b0+ b1x
–> r^2=R^2= determinationskoefficienten
MULTIPEL REGRESSION
–> 1 BV, flera OV
–> Med utgångspunkt i information om b1,b2, b3 vill vi kunna uttala oss om Y.
–> y=bo+ b1x + b2x + b3x
–> R^2 den multipla determinationskoefficienten
Nämn en viktig fördel med multipel regression
Vi kan utvärdera den relativa betydelsen för olika prediktorer, dvs vilken OV som har starkast samband med BV
Nämn några fördelar med multipel regression jämfört med ANOVA
- Man kan använda både kvalitativa/kategoriska och kvantitativa OV
–> behöver ej omvandla kvantitative OVs till nominalnivå, vilket vi måste om vi ska lägga in o ANOVA - Man kan enkelt lägga in flera OV samtidigt i modellen
- Man kan analysera både experimentell och icke-experimentell data
När är ANOVA att föredra framför regression?
- Om man arbetar med kvalitativa variabler och mycket få OV t.ex. vid experiment
- Om man förväntar sig flera interaktionseffekter, är anovalättare att tolka
I grunden är det samma beräkninar som görs, därmed kommer resultaten bli likvärdiga
Vad innebär multipel regression?
- Vid multipel regression lägger vi till en eller flera OV som tillsammans skall förklara hur stor del av BV som kan förklaras av de olika OV
- Multipel regression ger även de unika bidragen till BV för respektive OV
–> Dvs hur mycket en OV förklarar när man kontrollerar för den andra OV:n
–> R^2 part = determinationseffekten för specifika OV:n när man kontrollerar för de andra.
Hur läser man av resultaten av multipel regression i SPSS
- Bivariata korrelationskoefficienter r
–> Kolla pearssons correlations under “correlations” för respektive OV - R^2
–> läses ut under model summary
–> inkluderar förklarad varians av alla OV:s - Standardised coefficients beta
–> Sambandet mellan en prediktor och BV när alla andra prediktorer hålls kontastant - Om R^2 ökar när t.ex. lägger till fler variabler innebär det att vi förbättrar vår modell med delta%
- Om standardized coefficents beta minskar för specfik OV när vi lägger till fler OV innebär det att en del av den förklarade variansen istället förklaras med den nya OV:n
- Icke-standardiserad regressionskoefficient, b
–>för varje skalstegsökning i OV ökar BV med b när man kontrollerar för andra OV
–> kan vara svårt att använda om man har olika skalar mellan sina olika OV:s
–> det är detta värdet som är b1, b2 och b3 för resp. OV. - Standardiserad regressionskoefficient= beta
–> här har man gjort om icke-standardiserad regressionskoefficient b på samma skala till std.
–> Dessa kan man jämföra mellan de olika OV:s dvs. ju högre beta desto starkare prediktor för BV
–> kontrollera signifikans i tabellen.
Hur kan man predicera intention att vaccinera sig?
- Man använder sig av regressionsekvationen, y=b0+b1x+b2x
–> om man vet en specifik persons värde för de olika OV:s kan vi lägga in detta i ekvationen och räkna ut vårt y, vår BV
Vad menas med korrelation dvs zero-order i SPSS?
Enkel bivariat korrelation
–> korrelationen mellan en av prediktrerna och beroende variabeln är UTAN HÄNSYN till andra variabler
–> r för BV och OV1=area 1+2
–> r för BV och OV2=area 2+3
Vad menas med partiell korrelation dvs “partial” i SPSS?
Korrelationen mellan OV1 och BV när övriga OV:s är KONSTANTHÅLLNA
–> r för BV och OV1= area 1+2 (från OV1) - 2 (från OV2) vid korrelation mellan OV1 och OV2
–> r för BV och BV2= area 3 + 2(från OV2) - 2 från OV1