Regression Flashcards
Inkl. Bivariat regression, multipel regression
Hvad er forskellen på en independent, paired, pearson korrelation og bivariat regression?
Independent = forskellen mellem variable
Paried = forskellen mellem variable
Pearson korrelationsanalyse = sammenhæng mellem variable
Bivariat = Sammenhæng mellem stigning i variable
Hvordan måler man, hvor stor effekterne er i hhv. t-test, chi-squared test, korrelationsanalyser og lineær regression?
T-test = Cohen’s d
Chi Square Test = Phi og Cramer’s V
Korrelationsanalyse = korrelationskoefficienten
Lineær regression = Regressionskoefficient (betakoefficienten)
Hvad er regressionsanalyser?
Regressionsanalyser handler om at kunne forudsige sammenhænge
Hvordan måler man effektstørrelsen, såfremt der er signifikans i lineær regressionsanalyser?
Det måler man via regressionskoefficienten (betakoefficienten)
Hvad er R-squared (R^2) ?
Hvor meget af variansen er forklaret af vores data.
Jo højere R-squared er, jo mere kan man forklare.
Hvad er ustandardiserede betakoefficient?
Det relaterer sig til hældningen, men viser den direkte affekt.
Den måler på den skala, de respektive uafhængige variabler er på (aka den bruger ens skala fra ens spørgeskema).
Hvad er Standardiserede betakoefficient?
Det relaterer sig til hældningen, men viser effekten målt standardafvigelsen.
Man bruger standardafvigelsen til at standardisere, at al ens data bliver standardiseret til én data således forskellige skalaer kan holdes op mod hinanden (F.eks. Kan man sammenligne en 5-skala med en 7-skala)
Hvad er standardfejl (std. Error of the estimate)?
Standardfejl er standardafvigelsen forbundet med de ustandardiserede residualer (forskelle mellem observerede værdier versus det forudsagte)
Hvornår bruger man de ustandardiserede versus standardiserede betafoefficienter?
Hvis man har en analyse hvor alle en uafhængige variabler er på samme skala (e.g. likertskala 1 - 5) kan man sagtens bruge de ustandardiserede betakoefficient. De har samme skala så de kan sagtens sammenlignes direkte.
Hvis vi derimod har forskellige variabler med forskellige skala (e.g. køn, alder, antal års uddannelse, likertskala 1- 5) så skal man bruge de standardiserede betakoefficient for at se hvilken variable har størst effekt. Hvis man ikke gør det ignorer man at de opererer på forskellige skala som gør at de ikke direkte kan sammenlignes.
Hvad er forskellen på homoskedasticitet og heteroskedasticitet? Og hvorfor kan der være et problem?
Homoskedasticitet = Dataen er ligeligt fordelt over linjen (dermed er grundantagelse 7 i regressionsnalayseropfyldt)
Heteroskedasticitet = Standardafvigelsen vil variere meget, hvorfor lineær regressionsanalyse ikke vil være muligt, (grundantagelse 7 er dermed ikke er opfyldt, hvis der udvises heteroskedasticitet)
Forklar dummy variabler
Er noget til stede (1), betyder det, at noget andet ikke er til stede (0)
(F.eks. Mand/kvinde)
Hvad skal man være særlig opmærksom på, hvis man arbejder med kategorisk data i sin regressionsanalyse?
Hvis man laver dem på kategorisk data, skal man huske, at de skal have ét reference punkt, og dummy kode de andre variabel
F.eks. Kan ens referencepunkt være ”single”, og så kan hhv. ”gift” og ”fraskilt” være ens dummy koder
Der skal altså være noget over for noget andet.
Hvad er bivariat regression?
Man undersøger smamenhæng mellem stigning i variable.
En bivariat regression er, der hvor vi prøver at forudse ændringen i en værdi, baseret på ændringen i en anden værdi (der er dermed to variabler i en bivariat regression = én afhængig og én uafhængig variabel).
Hvilken form for data bruges til bivariat regression? (kategorisk/kontinuerligt)
Kontinuerlig data - såfremt der er kategorisk, skal man dummy kode
Hvad er de to vigtigste begreber i bivariat regression?
- Hældning = repræsenterer mængden af ændring i Y som funktion af en enhedsstigning i X. Værdien af en hældning kan enten være positiv eller negativ. Det måles gennem betakoefficient.
- Skæringspunktet = kan betragtes som grundlaget for regressionsligningen, da det kan betragtes som udgangspunktet for ligningen. Skæringspunktet repræsenterer den forudsagte værdi af Y, når X er nul