Regresjonsanalyser Flashcards
Gjengi formelen for en enkel regresjonsmodell
Y = a+BX+E
Forklar Y, E og X i denne formelen “Y = a+BX+E
Y er avhengig variabel og X er uavhengig variabel
E er feil leddet
Forklar B og a i denne formelen “Y = a+BX+E”
a er interseptet - verdien til Y når X = 0
B er stigningslinja - sier hvor mye Y endres når X økes med 1 enhet
Hva er interseptet i denne formelen “Y= a+BX+E
a er interseptet
Hva handler basisprediksjonen om?
Hva betyr basisprediksjonen?
Alle verdi i variabelen Y er lik gjennomsnittet til Y^-
Hva betyr denne formelen?
Alle verdier i variabel Y (observert verdi) = predikert verdi til Y (gjennomsnitt) pluss E (avviksskårer).
Derfor kan vi regne ut E ved å trekke gjennomsnittet fra Y, som vi ser over den røde streken.
Hva handler regresjonsanalytiske prediksjoner om?
Det handler om å predikere verdien til Y basert på formeluttrykket Y = a+BX + E
Hva er en bivariat regresjonsanalyse?
Den består av 1 AV og 1 UV og likner på kovarians eller korrelasjon
Hva er forskjellen på matematiske regresjonsmodeller, slik som “Y= a+BX” og statistiske modeller, slik som basisprediksjonen?
Matematisk regresjonsmodeller som denne er uten feil, mens statistiske modeller slik som basisprediksjonen involverer et feil ledd.
Hva er forskjellen på y og ȳ?
ȳ er predikert Y verdi
Hva er forskjellen mellom ustandardiserte og standardiserte regresjonskoeffisenter?
Den ustandardiserte regresjonskoeffisenten B sier hvor stor endring det er i Y når X øker med 1 enhet
Når koeffisienten er standardisert kalles den beta og uttrykker endringen i standardavvik
Hva betyr kvadrerte korrelasjonskoeffisenter?
r^2
de uttrykker hvor mye varians to variabler har til felles
Hva betyr kvadrerte, standardiserte regresjonskoeffisenter?
de uttrykker hvor mye av variansen i den avhengige variabelen som kan forklares av den uavhengige variabelen
Identifiser sentrale deler av en regresjonsanalyse, her; Model summary tabellen
Justert R2 betyr at den kvadrerte korrelasjonen mellom Y og X er korrigert i forhold til utvalgsstørrelsen og antall uavhengige variabler.
R er multippel R og tallet under er korrelasjonen mellom Y og X (korrelasjonskoeffisient)
R2 er kvadrert multippel R og tallet under er korrelasjon mellom Y og X kvadrert og viser hvor mange prosent av variansen i Y som forklares av modellen.
RMSE er root mean square error og kalles også standard error of the estimate. RMSE er standardavviket til residualene, altså variabel E.
Hva skal rapporteres om fra “Model summary” tabellen i JASP?
“justert R^2 = .25”
Identifiser sentrale deler av en regresjonsanalyse, her; ANOVA tabell
Regression er kvadratsummen til variabelen Y^-Y- og forteller hvor mye bedre prediksjonene blir ved hjelp av regresjonsmodellen sammenliknet med basismodellen
Residual er kvadratsummen til feilvariabelen E
Total er kvadratsummen til variabelen Y
Sum of squares (SS) er kvadratsum og her viser den kvadratsummen til ulike deler av en predikert variabel.
Df er frihetsgrader
Mean square er SS / df
Hva betyr dette?
Den totale variansen i en variabel kan deles inn i varians som forklares av modellen (regression) og varians som ikke forklares av modellen (residua)
Fordi verdien til regression er halvparten av totalen så kan vi si at modellen forklarer halvparten av variansen i Y - og dette skal også stemme overens med kvadrert multippel r
Hva skal rapporteres fra ANOVA tabellen i JASP?
F(1, 2) = 2.00, p = .293.
(1,2) er df - 1 + 2
2.00 er f-verdien
Verdien til en f-fordeling har samme funksjon som en t-verdi.
Signifikans(p-)verdien til F avgjør om modellens prediksjon er signifikant.
Identifiser sentrale deler av en regresjonsanalyse, her; Coefficents (regresjonsvekter)
Kolonnene standardisert (z-transformert) og ustandardisert viser til to ulike analyser og tallene som oppgis i disse er da verdien til a og B standardisert og ustandardisert
Ustandardisert regresjonsvekt skrives B og a
Standardisert regresjonsvekt skrives β eller b og a
Standardfeilen (SE) sier hvor nøyaktig vi kan estimere populasjonsparameteret fra vår utvalgs statistikk
t er t-verdi og p er p-verdi/signifikans verdi
Intercept er a i formelen
Timer er navn på den uavhengige variabelen
Tallet 0,7 under standardisert beskriver korrelasjonen mellom x og y i en bivariat analyse, på samme måte som kvadrert multippel r i den første tabellen
Y = a+BX+E ville da i denne tabellen blitt slik Y = 2+1X
Hva skal rapporteres om fra coefficents tabellen i JASP?
Informasjon om regresjonsvekter skal rapporteres slik
“Den standardiserte regresjonskoeffisenten var ikke signifikant, β= .71, t(2) = 1.41, p = .293. Her må man da vite df, som her er N-k-1 (k = antall UV) og da 4-1-1=2.
Hva er forskjellen på en standardisert og ustandardisert regresjonskoeffisånt/vekter?
I hvilken rekkefølge skal det rapporteres om fra en regresjonsanalyse?
Først rapporteres statistikk om modellen og så regresjonskoeffisentene/vekter.
Hva er forskjellen på en god og dårlig regresjonsmodell?
Hva kjennetegner standardiserte (z-tranformerte) variabler?
Disse har andre tall verdier enn de opprinnelige og de har alltid gjennomsnitt på 0 og standardavvik på 1.
B verdien vil endre seg også etter en z-transformasjon og a er alltid lik 0.