Uge 43 - Lektion 10 - Bivariat regression Flashcards

1
Q

Forklar hvad en bivariat regression kan i forhold til Pearson korrelation

A

Pearson korrelation
En Pearson-korrelation er en meget nyttig statistik til at estimere sammenhængen mellem to variable målt på en kontinuerlig skala. → siger ikke noget om forudsigelser!
Den kan nok ikke lave specifikke forudsigelser, hvilket ofte er formålet med at udføre en statistisk analyse.

Bivariate regression
Bivariate regression kan hjælpe med at se på, hvad der sker når der laves en ændring i en uafhængig variabel hvilken ændring medfører det så i den afhængige variabel
Fx:
Indkomst (Y = afhængig variabel) forudsagt af Antal år under Uddannelse (X = uafhængige variabel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er to vigtige begreber i sammenhæng med bivariat regression?

A

Hældning og skæringspunkt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Forklar hældning

A

Hældningen repræsenterer mængden af ændring i Y som funktion af en enheds stigning i X. Værdien af en hældning kan enten være positiv eller negativ.
Fx: For hvert år du har været længere uddannet, hvordan påvirker det din indkomst?

Hvis der er en stejl hældning vil det sige at hvert år mere uddannelse vil det give en stor ændring i indkomst → stor effekt
Hvis hældningen er mere flad vil det sige, at hvert år mere uddannelse ikke vil have den store ændring i indkomst → lille effekt
Hældningen siger altså noget om effekten → bliver målt gennem beta-koefficienten, som fortæller os hældningen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Forklar skæringspunkt

A

Skæringspunktet kan betragtes som grundlaget for regressionsligningen, da det kan betragtes som udgangspunktet for ligningen.

Skæringspunktet repræsenterer den forudsagte værdi af Y, når X er nul.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Forklar ustandardisert og standardiseret beta koefficienter

A

Ustandardiseret betakoefficient → Er den direkte effekt
fx. En stigning i uddannelse på 1 år, vil medføre en stigning på 2777,446 dollars om året.

Standardiseret betakoefficient → Bliver målt på standardafvigelse (+ / - 3 til begge sider)
Hvor meget en ændring i standardafvigelsen gør det, hvis man stiger 1 år i uddannelse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad forklarer “Model summary” i SPSS

A

Model summary → Hvor meget af variansen som er forklaret af vores data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Forklar R Square

A

R Square er Pearson korrelation kvadreret.

Dvs. hvor meget forklarer vores uafhængige variabel af vores overordnet data?

Anden definition:
Hvis vi kvarterer Pearson korrelation (R square), giver det os variansen i den afhængige variabel, som den uafhængige variabel tager højde for.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Forklar grundantagelserne ved bivariat regression

A

1.Tilfældig stikprøve: Alle individer i populationen skal have lige stor chance for at blive udvalgt til stikprøven.

2.Uafhængighed af observationerne: Deltagere i undersøgelsen har ikke påvirket hinanden med hensyn til variablerne af interesse.

3.Variable(r) er interval/ratio skala (eller minimum 5-trins skala på den ordinalmålestok).

  1. Linearitet: Person korrelation antager et lineært forhold mellem de afhængige og uafhængige variable. → lav et scatterplot for at tjekke!

5.Normalt distribuerede residualer: For at evaluere normalitetsantagelsen undersøge fordelingen af Jeres residualer. Benyt IQRx3 reglen.

6.Uafhængighed af Fejl (relevant for tidsseriestudier): Observationer skal være uafhængige afhinanden. Brug Durbin-Watson her.
Durbin-Watson-statistikken kan variere fra 0 til 4. Værdien 2 angiver et totale fravær af en seriel korrelation

  1. Dine data skal vise homoscedasticitet, hvilket betyder at vores data skal være relativ ligeligt fordelt på begge sider.

Hvis det ikke er det, kalder vi det heteroscedasticitet → det er bare ærgeligt hvis man ser dette i ens data

Heteroscadistiscet er data hvor det er meget lige fordelt nogle steder, og mindre fordelt andre steder
Ved heteroscadisticet bliver vores fejlmargin større og større
Ved homoscedacitet er vores fejlmargin ligestor over det hele
Vi kan undersøge grundantagelsen ved at kigge på Zresid og Zpred

How well did you know this?
1
Not at all
2
3
4
5
Perfectly