Forelesning 2 - Regresjonsanalyse 1 Flashcards
Gjengi formelen for en enkel regresjonsmodell og forklare hva den betyr.
Y = a + BX+ E
Y er avhengig variabel.
X er uavhengig variabel.
E er feilvariabelen.
a er interseptet, det vil si verdien av Y når X = 0
B er stigningslinjen. Den sier hvor mye Y endres når X øker med 1 enhet.
Vite hva basisprediskjonen er.Skriv formelen, Basisprediksjonen sier at alle verdiene i en variabel (..). SÅ basert på denne modellen så predikerer man (…)
Y = Ȳ
Basisprediksjonen sier at alle verdiene i en variabel er lik variabelens gjennomsnitt. Så basert på denne modellen så predikerer man verdien til Y basert på Ȳ (Ȳ er gjennomsnittet til Y).
Vite hva regresjonsanalytisk prediksjoner er.
Å predikere verdien til Y basert på formeluttrykket Y = a + BX+ E.
.
Kunne forskjell på Y og Y ̂.
Y er den observerte eller faktiske observasjonen, mens Y ̂ er predikert Y. For eksempel, hvis du bruker en modell, for eksempel en lineær regresjonsmodell, for å predikere høyden til personer basert på andre variabler som alder, kan Y ̂ være de beregnede prediksjonene for høyden basert på modellen.
Kjenne til forskjellen mellom ustandardiserte og standardiserte regresjonskoeffisienter.
Den ustandardiserte regresjonskoeffisienten B sier hvor stor endring det er i Y når X økes med 1 enhet. Når koeffisienten er standardisert kalles den beta og utrykker endringen i standardavvik.
For eksempel:
Ustandardisert: Når X øker med 1 enhet så øker Y med 20.
Standardisert: Når X øker med 1 SD så øker Y med 0.35 SD.
Beskrive hva kvadrerte korrelasjonskoeffisienter (r^2) betyr.
Kvadrerte korrelasjonskoeffisienter (r^2) uttrykker hvor mye varians to variabler har til felles.
Beskrive hva kvadrerte, standardiserte regresjonskoeffisienter (beta-tegn^2 eller b^2) betyr.
Kvadrerte, standardiserte regresjonskoeffisienter (betategn^2/b^2) uttrykker hvor mye av variansen i den avhengige variabelen som kan forklares av den uavhengige variabelen
Identifisere sentrale deler av en regresjonsanalyse fra en JASP utskrift.
Model Summary
Hva er:
Lilla pil
Blå pil H0
R, og hva kalles det
R2, og hva kalles det
Rød pil 0.250
RMSE står for
- Lilla pil: Navn på avhengig variabel
- Blå pil H0: Basisprediksjonen Ȳ og Y ̂.
- R kalles: multippel R
- R2 kalles: kvadrert multippel R
- Rød pil 0.250: Justert R2
- RMSE står for: Root mean square error
Hva er RMSE?
Root mean square error er standardavviket til residualene, altså variabelen E.
ANOVA
Hva er:
* Grønn pil
* Lilla pil
* Rød pil
* Sum of squares, hva står det for?
* Df, hva står det får?
* Mean square, formel?
* Sort pil 2.000
* Blå pil 0.293
*
- Grønn pil = kvadratsummen til variabelen Y ̂-Ȳ .
Denne viser hvor mye bedre prediksjonen ved hjelp av regresjonsmodellen sammenlignet basisprediksjonen. - Lilla pil = kvadratsummen til feilvariabelen/residualen (E)
- Rød pil = kvadratsummen til variabelen Y
- Sum of squares (SS) = kvadratsum, her for ulike deler av en predikert variabel
- df = frihetsgrader
- Mean square = SS/df
- Sort pil 2.000 = Verdien til en F-fordeling
- Blå pil p = Signifikansverdien til F, avgjør om modellens prediksjon er signifikant
Regresjonsvekter
Hva er:
* Blå pil
* Tallet 3
* Tallet 1
* Tallet 7
* Tallet 1.291
* Tallet 0.707
* Tallet 1.414, hvordan regner man det?
* Tallet 0.293
- Blå pil H0 = basisprediksjonen
- Tallet 3: Dette er den ustandardiserte verdien till a/interseptet
- Tallet 1: Dette er den ustandardiserte regresjonsvekten
- Tallet 7: Dette er gjennomsnittet til alle verdiene, derfor Ȳ (basisprediksjonen)
- Tallet 1.291: Dette er standardfeilen i basisprediksjonen.
- Tallet 0.707: Dette er den standardiserte regresjonsvekten, og det er denne som skal rapporteres.
- Tallet 1.414: Dette er t-verdien. Og denne skal rapporteres. Denne finner man ved å ta B/SE, så her 1/0.707.
- Tallet 0.293: Dette er p-verdien til t-verdien ved siden av. Denne skal rapporteres.
Rapportere resultatene fra en enkel regresjonsanalyse.
Model Summary
ANOVA
Coefficients
Informasjon fra:
Model Summary som skal rapporteres:
* Justert R2
*
ANOVA som skal raporteres:
* Informasjon fra F-testen: F(1, 2)= 2.00, p = .293
* (1,2) er frihetsgradene til regresjon og residual
* 2 er F-verdien
Coefficients (regresjonsvekter) som skal rapporteres:
Slik: Den standardiserte regresjonskoeffisienten var ikke signifikant, β=.71, t(2) = 1.41, p = .293
* Den standardiserte regresjonsvekten (β)
* T-verdien med frihetsgrad
* P-verdien til t-verdien
Hvordan regner man frihetsgradene til t-verdien?
Frihetsgrad regnes ut N-k-1, der k = antall uavhengige variabler. Dette er den samme verdien som står på df til residual.
Hva er parametere og variabler i en enkel regresjonsmodell Y = a + BX+ E? Og hvordan estimeres parametere?
Y, X og E er variabler
a og B er parametere.
Statistiske modeller inneholder parametere, og disse må estimeres, det vil si regnes ut ved hjelp av statistikk.
Hva er E i en regresjonsmodell?
E er feilvariabelen og er den variansen i Y som ikke kommer fra X