Uge 43 - Lektion 10 - Bivariat regression Flashcards
Forklar hvad en bivariat regression kan i forhold til Pearson korrelation
Pearson korrelation
En Pearson-korrelation er en meget nyttig statistik til at estimere sammenhængen mellem to variable målt på en kontinuerlig skala. → siger ikke noget om forudsigelser!
Den kan nok ikke lave specifikke forudsigelser, hvilket ofte er formålet med at udføre en statistisk analyse.
Bivariate regression
Bivariate regression kan hjælpe med at se på, hvad der sker når der laves en ændring i en uafhængig variabel hvilken ændring medfører det så i den afhængige variabel
Fx:
Indkomst (Y = afhængig variabel) forudsagt af Antal år under Uddannelse (X = uafhængige variabel)
Hvad er to vigtige begreber i sammenhæng med bivariat regression?
Hældning og skæringspunkt
Forklar hældning
Hældningen repræsenterer mængden af ændring i Y som funktion af en enheds stigning i X. Værdien af en hældning kan enten være positiv eller negativ.
Fx: For hvert år du har været længere uddannet, hvordan påvirker det din indkomst?
Hvis der er en stejl hældning vil det sige at hvert år mere uddannelse vil det give en stor ændring i indkomst → stor effekt
Hvis hældningen er mere flad vil det sige, at hvert år mere uddannelse ikke vil have den store ændring i indkomst → lille effekt
Hældningen siger altså noget om effekten → bliver målt gennem beta-koefficienten, som fortæller os hældningen
Forklar skæringspunkt
Skæringspunktet kan betragtes som grundlaget for regressionsligningen, da det kan betragtes som udgangspunktet for ligningen.
Skæringspunktet repræsenterer den forudsagte værdi af Y, når X er nul.
Forklar ustandardisert og standardiseret beta koefficienter
Ustandardiseret betakoefficient → Er den direkte effekt
fx. En stigning i uddannelse på 1 år, vil medføre en stigning på 2777,446 dollars om året.
Standardiseret betakoefficient → Bliver målt på standardafvigelse (+ / - 3 til begge sider)
Hvor meget en ændring i standardafvigelsen gør det, hvis man stiger 1 år i uddannelse
Hvad forklarer “Model summary” i SPSS
Model summary → Hvor meget af variansen som er forklaret af vores data
Forklar R Square
R Square er Pearson korrelation kvadreret.
Dvs. hvor meget forklarer vores uafhængige variabel af vores overordnet data?
Anden definition:
Hvis vi kvarterer Pearson korrelation (R square), giver det os variansen i den afhængige variabel, som den uafhængige variabel tager højde for.
Forklar grundantagelserne ved bivariat regression
1.Tilfældig stikprøve: Alle individer i populationen skal have lige stor chance for at blive udvalgt til stikprøven.
2.Uafhængighed af observationerne: Deltagere i undersøgelsen har ikke påvirket hinanden med hensyn til variablerne af interesse.
3.Variable(r) er interval/ratio skala (eller minimum 5-trins skala på den ordinalmålestok).
- Linearitet: Person korrelation antager et lineært forhold mellem de afhængige og uafhængige variable. → lav et scatterplot for at tjekke!
5.Normalt distribuerede residualer: For at evaluere normalitetsantagelsen undersøge fordelingen af Jeres residualer. Benyt IQRx3 reglen.
6.Uafhængighed af Fejl (relevant for tidsseriestudier): Observationer skal være uafhængige afhinanden. Brug Durbin-Watson her.
Durbin-Watson-statistikken kan variere fra 0 til 4. Værdien 2 angiver et totale fravær af en seriel korrelation
- Dine data skal vise homoscedasticitet, hvilket betyder at vores data skal være relativ ligeligt fordelt på begge sider.
Hvis det ikke er det, kalder vi det heteroscedasticitet → det er bare ærgeligt hvis man ser dette i ens data
Heteroscadistiscet er data hvor det er meget lige fordelt nogle steder, og mindre fordelt andre steder
Ved heteroscadisticet bliver vores fejlmargin større og større
Ved homoscedacitet er vores fejlmargin ligestor over det hele
Vi kan undersøge grundantagelsen ved at kigge på Zresid og Zpred