Enkel regressionsanalys Flashcards
Hur placeras regressionslinjen i förhållande till observerade datapunkter? (2p)
Så att residualerna (dvs kvadrerade skillnaderna mellan observerade och enligt regressionslinjen predicerade värden) minimeras.
TENTAFRÅGA:
Beskriv formeln för regressionslinjen (ledtråd: ”a”, ”b”). (?p)
y = a + b*x
y = BV a = intecept b = lutning x = OV
Allt annat konstant, vad händer med regressionslinjen när korrelationen mellan prediktorn och utfallsvariabeln minskar? (?p)
Den planas ut.
TENTAFRÅGA:
Regressionslinjen går alltid genom en viss punkt. Vilken? (2p)
Medelvärdet för y respektive x.
X På vilket sätt skiljer sig β (beta) från ”den ordinarie” regressionskoefficienten b? Vilken
fördel har β jämfört med b? (2p)
B:
Hur många enheter ökar y när x ökar en enhet
Beta:
Standardiserad version av b.
Fördelar: påverkas ej av mätenhet och går därför att användas som mått på prediktiv förmåga.
X Vad innebär ”regressions SS” respektive ”residual SS” vid en enkel regressionsanalys? (2p)
Regressions SS:
SS som återstår när observerade värden ersätts med predicerade värden.
Residual SS:
SS som går förlorad när observerade värden ersätts med predicerade värden.
X TENTAFRÅGA:
Vid regressionsanalys använder man sig av två olika frihetsgrader (df). Vad kallas dessa
och hur beräknas de? (2p)
Regressions df:
p
Residual df:
N - p - 1
N = antal individer p = antal prediktorer
X Vad står ”R” respektive ”R2” för? (?)
R2:
Hur stor del av variansen i y som kan förklaras i variansen av x
R:
Korrelation mellan observerade och predicerade y-värden.
X Vad har man för antaganden angående varians och fördelning i utfallsvariabeln vid enkel
regressionsanalys? (?)
Vi antar att i populationen så är:
- Variansen i y samma för alla nivåer på x.
- Y-värdena normalfördelade för alla nivåer på x.