Korrelation & regression Flashcards

1
Q

När skall man göra vilken typ av korrelationstest?

A
  1. Pearson korrelation
    –> korrelationskoefficient r
    –> 1 OV
    –> godtyckligt antal nivåer
    –> OV på intervall/kvot skala
    –> BV på kvot/intervall skala
  2. Spearman korrelation
    –> korrelationskoefficient rho
    –> 1 OV
    –> godtyckligt antal nivåer av OV
    –> OV på ordinalskalenivå
    –> BV på ordinalskalenivå
    –> mindre känslig för outliers
  3. Multipel regression
    –> 2 eller fler OV
    –> godtyckligt antal nivåer
    –> OV på intervall/kvotnivå
    –> BV på intervall/kvotnivå
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad innebär korrelation?

A
  1. Korrelation beskriver sambandet mellan två variabler. Om de är:
    –> orelaterade
    –> positivt korrelerande, r=1 (perfekt positiv korrelation)
    –> negativt korrelerade, r=-1 (perfekt negativ korrelation)
  2. Korrelationen anger styrkan i ett linjärt samband
  3. Korrelation kräver parvisa mätningar t.ex. kreativitet & ålder, attityd & beteende osv
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är korrelation för någon typ av design?

A

Korrelation är en icke-experimentell design
–> ingen kontroll
–> ingen manipulation
–> korrelation kan inte säga någonting om kausaliteten
–> metod för att mäta korrelation är vanligen enkätstudier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hur går hypotesprävning av r till?

A

Det finns en korrelationstabell för rkrit som beror av
–> p
–> df= n-2

Om r>rkrit förkastar vi Ho, dvs sannolikheten att vi har fått ett slumpresultat <5%.

Om r>0 positivt samband
Om r<0 negativt samband

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hur tolkar man storleken på korrelationen?

A
  1. utgå från tidigare studier
  2. Utgå från effekten i meta-analyser

Bara för att man har en signifikant effekt innebär det INTE att man har en meningsfull effekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

vad innebär determinationskoefficienten?

A
  1. Anger andel förklarad varians
    –> hur stor del av variationen i en variabel som kan härledas till variationen av den andra variabeln
  2. r^2=determinationskoefficienten
  3. Ett annat sätt att beskriva styrkan i sambandet
  4. Determinationskoefficienten är inte linjär

EXEMPEL
Sömnbrist & arbetsminne korrelation på r=0.76
r^2 = 0.58. –> 58% av variansen i arbetsminne förklaras av sömnbrist
–> innebär också att 42% av arbetsminne förklaras av andra orsaker och mätfel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad innebär homoskedasticitet?

A

Att variansen i Y är detsamma för alla X-värden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad inebär bivariat normalfördelning?

A

För varje x-värde är Y-värden normalfördelade
För varje Y-värde är x-värden normalfördelade

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad menas med att det kan finnas risker med “restriction of range”?

A

At endast titta på en specifik range av X t.ex. kan skapa en falsk bild av korrelationen.

Har man t.ex. en icke-linjär korrelation men endast tittar på nedre delen av skalan kan det se ut som att man har en positiv korrelation

Tittar man på mitten delen kan det se ut som att man inte har någon korrelation alls

Tittar man på övre delen av x-skalan kan det se ut som att man har en negativ korrelation

Medan man i själva verket har en icke-linjär korrelation.

Därför är det viktigt att titta på hela rangen!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är risken med outliers vad det gäller korrelation?

A

Outliersk kan skapa en falsk korrelation.

Det kan se ut som att vi har t.ex. en positivt linjär korrelaiton men i själva verket är det endast en datapunkt som är väldigt extrem.

Dessutom kan outliers minska faktiskt korrelationer

Viktigt att plotta korrelationerna för att förstå datan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad ska man akta sig vad det gäller korrelation?

A
  1. Kausalitet: Man kan inte veta någonting om kausaliteten i sambandet
  2. Skensamband
    –> Variablerna kanske inte beror av varandr utan av bakomliggande variabler eller alternativa förklaringar.
  3. Även små korrelationer kan bli signifikanta vid tillräckligt stort n
  4. Viktigt med teoretiskt grundade antaganden

EXEMPEL
positiv korrelation mellan personer som tror att bin laden var död när US invaderade hans byggnad i pakistan OCH de som tror att bin laden fortfarande lever. En tredje variabel kan förklara detta samband och det är tron på konspirationsteorier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Antaganden för att kunna göra korrelationsanalys?

A
  1. homoskedasticitet
    –> Att variansen i y är detsamma för alla x-värden
  2. Bivariat normalfördelning
    –> För varje x-värde är Y-värden normalfördelade
    –> för varje y-värde är x-värden normalfördelade
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

vad är regression användbart för?

A

Regression är användbart för att göra prediktioner dvs antaganden om hypotetiska utfall

Med utgångspunkt i information om X vill vi kunna uttala oss om Y

Man kan göra både enkel och multipel regressionsanalys

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad innebär enkel regressionsanalys?

A

Enkel regressionsanalys innebär
–> 1 BV
–> 1 OV

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

vad innebär Multipel regressionsanalys?

A

Multipel regressionsanalys innebär:
–> 1 BV
–> två eller fler OV (prediktorer)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Ge ett exempel på enkel regression

A
  1. Predicera Y från X
  2. Finns det ett samband mellan attityd och människors beteende?
    –> kan man med vetskap om en persons attityd predicera beteendet?
17
Q

Beskriv de olika begreppen inom regression

A
  1. Stora R
    –> i SPSS under model summary
    –> Gemensam korrelation mellan ALLA våra prediktorer (OVs) och BV
  2. R^2
    –> i SPSS under model summary
    –> Determinationskoefficienten
    –> Visar hur mycket barians i vår BV kan förklaras av vår OV
  3. p<0.05
    –> i SPSS under ANOVA
    –> testar om R och R^2 är signifikande

4.Regressionsekvationen, y=bo+b1x
–>y= BV
–> bo= kontakt/intercept. Predicerade värdet när x=0
–> b1= ostandardicerade regressionskoefficienten/ slope. Lutingen på linjen
–> bo= i SPSS under coefficients - (constant)
–> b1= i SPSS under coefficients - under (constant) om endast en prediktor.

5.

18
Q

Hur kan man räkna ut det predicerade värdet på BV?

A
  1. Man Räknar ut mha regressionsekvationen y=bo+ b1x.
  2. bo och b1 hämtas från coefficients i SPSS
  3. då kan man räkna ut predicerade Y givet olika
19
Q

Vad innebär den standardiserade regressionskoefficienten B?

A
  1. Den standardicerade regressionskoefficienten B uttrycker relationen mellan X och Y i termer av standardavvikelser.
  2. Innebär att man kan jämföra flera regressionskoefficienter med varandra trots att de mätts på olika skalor
  3. Utläses i SPSS under Coefficients.
  4. Om OV (X) ökar med en standardavvikelse, innerbär det att BV i genomsnitt ökar med Beta.
20
Q

vad menas med bivariat regression?

A

Bivariat regression är detsamma som enkel regression, dvs endast 1 OV

21
Q

Skillnad mellan Enkel och multipel regression?

A

Vid enkel regression är determinationskoefficienten R^2=r^2

Vid Multipel regression är R^2 den totala förklarade variansen i Y för samtliga prediktorer.

22
Q

Om vi t.ex. har 66& förklarad varians, vad är de resterande 43%?

A
  1. mätfel
  2. Variabler vi inte mätt