Regresjonsanalyse 1 Flashcards
Hva kan man si om bruken av regresjon?
Regresjon er den mest brukte og eldste statistiske analyse, og benyttet innen nær sagt alle fagfelt.
Hva har ANOVA og lineær regresjon til felles?
Begge er varianter av den generelle lineære modellen (GLM).
Hvilke forutsetninger har regresjon til felles med ANOVA og hvilke er unike for regresjon?
Forutsetninger regresjon har til felles med ANOVA er uavhengighet, homoskedastisitet og normalitet.
I tillegg har regresjon en forutsetning om lineæritet og lav kolinaritet.
Hva slags variabler er de uavhengige i regresjon?
De kan enten være kontinuerlige eller kategoriske.
Hva er forskjellen på korrelasjonskoeffisienter og regresjonkoeffisienter?
Korrelasjonskoeffisienten beskriver styrken i relasjonen mellom to variabler.
Regresjonskoeffisienten beskriver også styrken, men den kan også predikere.
Hva er hovedbruksområdene for multippel lineær regresjon?
Individuelle forskjeller: Man kan bruke MLR for å avgjøre hvilke variabler (slik som individuelle forskjeller, eks, personlighetstrekk, aktivitetsnivå og humør) som best forklarer et utfall/feonmen.
Statistisk kontroll:I MLR så er vi vanligvis i en eller noen få bestemte variabler, men så ønsker vi å vite hva effekten av disse blir om vi justerer for variablene vi vet også henger sammen med utfallet, og kanskje dels med prediktoren. Dette kalles for kovariat, og dette gir en justert beta-vekt.
Inkrementell validitet: Inkrementell validitet viser hvor mye en ny test eller målesinstrument forbedrer prediksjonen utover eksisterende tester.
Hierariske regresjonsanalyser: Vi kan teste hvilke grupper med prediktorer/UV som bidrar mest til å forstå utfallet, og også hvilke variabler innad i gruppen som bidrar mest.
Hva beskriver regresjonsligningen?
Funksjonen beskriver relasjonen mellom Y (AV) og en eller flere prediktorvariabler (X). Linjen beskriver hvordan Y endrer seg når X endrer seg.
Hva er formelen for Observert Y?
beta0 (intersept) + beta1X1 + beta2X2 + … + e (feil)
Hva er formelen for predikert Y:
beta0 (intersept) + beta1X1 + beta2X2
Hva representerer interseptet?
Interceptet er verdien av den avhengige variabelen når alle de uavhengige variablene er lik null. Dette er skjæringspunktet på Y-aksen.
Hva er sentrering?
I regresjonsanalyse refererer sentrering til prosessen med å justere variabler ved å trekke fra gjennomsnittsverdien for hver observasjon i datasettet.
Dette betyr at hver verdi for den uavhengige variabelen justeres slik at den får et gjennomsnitt på null. Dette gjør interseptet mer meningsfullt.
Når vi har sentrert variablene blir interseptet lik verdien av gruppens gjennomsnitt.
Dersom en person skårer 110 og gjennomsnittet er 100, så vil denne personen få sentrert skåre 10, altså vedkommende skårer 10 poeng høyere enn gjennomsnittet. Poenget er at det skal sentreres slik at sentrert skåre er positiv for personer som skårer høyere enn snittet, og negativ i motsatt fall.
Hva skiller en ustandardisert fra en standardisert beta-vekt?
Ustandardiserte beta-koeffisienter bruker variablenes opprinnelige enheter og min/max verdi er uendelig. Mens standardiserte beta-koeffisienter omregnes til en skala fra -1 til 1 i SD for å kunne sammenligne effekten av variabler som har ulike måleenheter.
Intercepten blir irrelevant i en standardisert regresjon fordi både den avhengige og den uavhengige variabelen er transformert til z-skårer (standardisert). Når variablene er standardisert, har de et gjennomsnitt på 0 og en standardavvik på 1. Interceptet representerer verdien av den avhengige variabelen når alle prediktorene er null, men når variablene er standardisert, er gjennomsnittet 0, og derfor er også interceptet 0, og gir ikke noe meningsfull informasjon.
Hvordan tester vi signifikansen av beta-vekter i regresjon?
Beta-vektenes signifikans testes ved hjelp av t-tester, som måler om hver beta-vekt er lik null (nullhypotesen). Når beta-vektene er lik null så får vi en flat linje. H1 sier at beta-vektene er signifikant forskjellige fra 0 i populasjonen.
Hva er R2 og hvordan regner man det ut?
R2 = SSM/SST.
SSM er summen av den kvaderte forskjellen mellom gjennomsnittet av Y og modellen.
SST er summen av de kvadrerte forskjellene mellom observert data og gjennomsnittsverdien av y.
R2 representerer mengden av varians i Y (utfallet) som kan predikeres av modellen.
Hvilken metode brukes for å bestemme regresjonslinjen?
Ordinary least squares (OLS) er en metode for å finne den beste regresjonslinjen ved å minimere summen av de kvadrerte avstandene mellom observerte og predikerte verdier.
Hvordan regner vi ut beta og standardisert beta?
Hvordan regner vi ut interseptet?
Hvordan tolker vi et konfidensintervall for en beta-koeffisient?
Konfidensintervallet angir det området hvor vi 95 av 100 ganger vil få verdien til en beta-koeffisient hvis henter data fra et nytt utvalg i populasjonen.