Korrelation och regression Flashcards

1
Q

Kovarians

A

samvariationen mellan två variabler x och y. Hur en förändring i x påverkar y. Problem med måttet är att det påverkas av måttenheter –> går ej jmf, exempelvis huruvida X längd mäts i cm eller m, då får man ett annat mått på kovarians. Detta löser man genom att använda sig av korrelationer –> jmfbara

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Korrelation

A

sambandsmått som är kollar om det finns någon koppling mellan 2 variabler. Det förutsätter ett linjärt samband.
Hur stark denna koppling är mäts med Pearsons r (parametrisk) eller Spearmans p (icke-parametriskt).
Detta ger inte ett nått på kausalitet (orsakssamband) utan samband.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

När kan r ge ett missvisande/felaktikt resultat

A

r = pearsons korrelation

  • Två populationer, det är två olika populationer som mätts vilket ger upphov till ett linjärt samband som inte finns. Exempel, vuxna och barn mellan korrelation mellan skostorlek och lön.
  • Vid icke-linjärt samband, enligt perason kommer de säga att det inte finns ett samband men det kan ju finnas ett annat typ av samband. I dessa fall behöver ett annat måste
  • För begränsad variationsvidd, en begränsad del av datan har samlats in. Inget mått på samband men det kan mycket väl vara så att ett finns om man får in all data.
  • Outlier, få datapunkter nertill och någon outliers så kommer det att ge något som er ut som ett samband som egentligen inte finns.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Förklarad varians/delade variansen/determinationskoefficienten

A

Den kvadrerade korrelationskoefficient r2 (pearsons r). - Anger förklaringsgraden, alltså hur stor del av variationen i den ena variabel kan förklaras av variationen i den andra variabeln.

Exempelvis, om resultatet på två tentor korrelerar med r=.80 är den delade variansen .802=.64, då delar de 64% av variansen, 64% av variationen i den ena variabeln kan då förklaras av variationen i den andra variabeln. 100–64= 36% av variationen beror på något annat exempelvis att testen inte mäter samma sak eller slumpvariation. Detta kan illustreras i venndiagram.
Är intressant för att man får fram hur mkt av variansen i ena varabeln förklas av den andra variabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Effektstorlekar vid korrelation

A
Kriterierna för liten, måttlig och stor 
- r eller r2 används som mått på effektstorlek 
- Kriterier för bedömning: r vs  r2
Liten	0.1	0.01	
Måttlig	0.3	0.09	
Stor: >0.5	0.25
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Regression enkel

A

korrelation är ett mått på styrkan av sambandet mellan 2 variabler. Regression är en vidareutveckling av korrelation som tillåter prediktion via regressionsekvation Y´=a+bx (regressionslinjensekvationen, regr a skär i y-axel, b är lutningen).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

icke standardiserade regressionskoefficienten

A

Y´=a+bx

b är den icke standardiserade regressionskoefficienten som anger regressionslinjens lutning i måttenheter. Hur många skalsteg ökar Y’ då X ökar ett steg? linjens lutning (b)

b är skalberoende, resultaten kan inte jämföras.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Standardiserade regressionskoefficienten

A

β-värden anger X effekt på Y i SD,
β-värden från olika analyser kan jämföras tack vara standardiseringen. Den standardiserade regressionslinjen går genom 0,0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Multipel korrelation (R):

A

uttrycker den sammanlagda korrelationen mellan prediktorvariablerna (OBV) och kriterievariabeln (BV). Anger graden av sambanden mellan kombinationen av de oberoende variablerna och den beroendevariabeln.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Användnngsområde för multipel korrelation

A

Användningsområden:

  • flera oberoende variabler,
  • När man vill kontrollera för andra variablers inverkan på sambandet (3e variabeln).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad står R2 för?

A

förklaringsgraden, hur väl OBV fångar in BV. Förklarad varians!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Partiell korrelation (pr):

A

då vi vet alla parvisa korrelationer mellan 3 variabler så kan vi isolera sambandet mellan två av dessa, x och y genom att ta bort inverkan från den medierade variabeln z.
Varför kan man vilja göra en partiell korrelation? När vi vill ta bort inverkan från en medierande faktor på sambandet mellan två andra variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Semipartiell korrelation (sr):

A

man justerar bort den beroende variabelns påverkar på de oberoende variablerna. Man justerar bort den ena variabelns (här Z) effekt på en av de övriga variablerna (här Y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Multipel regression

A

tillåter prediktion av kriterievariabeln (BV) från flera prediktorer (OBV).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Olika metoder som används vid multipel regression

A

Standard multipel regression

Hierarkisk (sekventiell) multipel regression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Standard multipel regression

A

Standard multipel regression: alla prediktorvariabler (OBV) läggs in samtidigt. Denna används för att förklara så mycket varians som möjligt i data.

17
Q

Hierarkisk (sekventiell) multipel regression

A

Hierarkisk (sekventiell) multipel regression: Forskaren väljer den ordning som prediktorvariablerna (OBV) läggs in i regressionsekvationen och har man kontroll över analysproceduren. Det kan också vara att en modell bestämmer ordningen av prediktorvariabler (OBV). Detta är motsvarigheten till semi-partiella korrelationer.

Fördel:
När forskare själv väljer;
- det ger kontroll över hur analysen utvecklas samt möjlighet att testa explicita modeller/hypoteser.
- Möjligt att anpassa ordningen efter aktuell analysstrategi.

18
Q

Förklara begreppen total varians, förklarad varians och felvarians och hur dessa förhåller sig till varandra.

A

Total varians: summan av kvadrerade avstånden från varje observerat y till y’s medelvärde dividerat med n eller n-1. Vi struntar i att dividerat med n, eller med n-1, det är ju samma för alla termer –> vi håller oss till kvadratsumman SS=sums of squares.
Total varians = förklarad varians + felvariansen.

Förklarad varians: summan av kvadrerade avstånden från varje Y’ (= predicerad Y) till Y:s medelvärde

Felvarians (residualer): summan av kvadrerade avstånden från varje Y’(= predicerad Y) till varje observerad Y.

Total varians = förklarad varains + felvarians