Regresjonsanalyse Flashcards
Hva er en t-test?
En t-test er en type inferensiell statistikk som brukes til å bestemme om det er en signifikant forskjell mellom gjennomsnittet til to grupper, som kan være relatert i visse funksjoner.
Hvilke ulike typer t-tester har du ?
En One sample t-test tester gjennomsnittet for en enkelt gruppe mot et kjent gjennomsnitt.
En independent sample t-test sammenligner gjennomsnittet for to grupper.
En paired sample-test sammenligner gjennomsnitt fra samme gruppe til forskjellige tider (f.eks. med ett års mellomrom).
Hva er et scatterplott?
Et spredningsplott/scatterplott er et statistisk diagram for å vise verdien av to variabler fra et dataset. Spredningsplottet viser ulike punkter i et koordinatsystem som representerer en dataobservasjon. Plasseringen av et punkt langs aksene bestemmes av verdien til de to variablene som presenteres. Spredningsplott egner seg til å vise for eksempel sammenhenger og grupperinger i et dataset.
MKM - Minste kvadraters metode.
Avstanden fra punktene til den lineære linjen kalles residualer.
Hva er residualer?
Residualer bidrar til å forstå hvor godt regresjonslinja tilpasser
data og også å oppdage store avvik.
1. Gjennomsnittet til residualene skal være 0
RES1 - Analyse - se på gjennomsnitt - denne skal være 0.
2. Residualene skal ha konstant varians
• Har vi et problem med heteroskedastisitet – eller er dataene våre l . -homoskedastiske?
4. Residualene skal være normalfordelte
Er medianen lik gjennomsnittet?
• Indikasjon på at dataene ikke er «skjeve»
• men kan ikke utelukke for eksempel uniform fordeling
7. Fravær av multikollinearitet
Får vi høye og signifikante utslag på noen korrelasjoner mellom forklaringsvariablene (dvs. de uavhengige variablene) våre?
Hva er korrelasjon?
Korrelasjon er et statistisk mål på hvor mye to målbare størrelser henger sammen med hverandre. For eksempel betyr en positiv korrelasjon mellom høyde og vekt at høye folk ofte er tyngre enn lave folk.
Kalles også samvariasjon
Hva er enkel regresjonsanalyse ?
Ved enkel regresjonsanalyse forsøker vi å beskrive sammenhengen mellom en avhengig variabel, vanligvis kalt Y, og en uavhengig variabel (forklaringsvariabel), vanligvis kalt X.
Siden vi antar at sammenhengen ikke er perfekt, må vi også inkludere et feilledd.
Hva er den matematiske modellen for regresjonsanalyse?
Y=β0+βx+ε
Hva er Minste kvadraters metode? (MKM)
MKM er den mest brukte estimeringsmetoden. Ideen bak metoden er å finne fram til estimater som er slik at summen av de kvadrerte residualene blir så liten som mulig. Dette kalles gjennomsnittsentrering.
Residualer er differanse mellom observert Y og predikert Y.
Hva slags analyse er gjennomført her?
Multippel regresjonsanalyse
Hva er multippel regresjonsanalyse?
Når vi utvider fra enkel til multippel regresjonsmodell, betyr det at vi har flere enn èn uavhengig variabel.