Forelesning 6 Flashcards
Hva er kovarians? Hvordan skiller det seg fra variansen?
Variansen er et mål som viser hvor lang unna hver observasjon er fra gjennomsnittet. Kovarians er et mål som viser til forholdet mellom avvikene til to variabler fra deres gjennomsnitt. Mer presist er kovarians et mål på samvariasjonen mellom to variabler, det vil si hvor mye de endrer seg sammen.
Tegnet av kovariansen forteller om forholdet er positivt eller negativt. Verdien av kovariansen kan ha en hvilken som helst verdi (ikke begrenset mellom -1 og 1).
Problemet med kovarians er at verdien påvirkes av måleskalaen.
Beskriv hovedmålene med korrelasjonsanalyse! Hvordan kan vi kvantifisere en korrelasjon?
Hovedmålene med korrelasjonsanalyse er å undersøke sammenhengen mellom to variabler og vurdere hvor sterkt de er relatert til hverandre. En korrelasjon mellom to variabler sier noe om hvor mye den ene variabelen øker eller minker i samsvar med den andre variabelens øking eller minking. Korrelasjoner kvantifiserer graden av statistiske sammenhenger. Jo klarere forholdet er, desto sterkere er korrelasjonen. Korrelasjoner uttrykkes ofte med et tall mellom -1 og 1. Null står for fullstendig fravær av en korrelasjon. Positive verdier beskriver positive korrelasjoner; negative verdier beskriver negative korrelasjoner.
Hva representerer Pearsons korrelasjonskoeffisient?
Pearsons korrelasjonskoeffisient r er et standardisert mål på kovarians, som gjenspeiler det lineære forholdet mellom to variabler. Pearsons r varierer mellom -1 og 1, hvor 0 indikerer ingen korrelasjon, mens 1 og -1 reflekterer perfekte positive og negative korrelasjoner.
0 står for fravær av sammenheng mellom de to variablene.
Hvordan kan vi teste signifikansen av en korrelasjon?
For å finne ut om en korrelasjon er signifikant eller ikke må vi bruke Pearsons r. Man må benytte seg av en one sample t-test, der man sammenligner en t-score med en forhåndsbestemt verdi. Den forhåndsbestemte verdien vil i dette tilfelle være 0 siden man antar at det ikke er en korrelasjon. Pearsons r må på bakgrunn av dette konverteres til en t-score. Vi kan bruke denne t-scoren til å teste hvor signifikant forskjellig vår t-score er fra 0, fordi vår H0 sier at den er lik 0. Så hvis r = 0, så er t = 0
Hva kan vi konkludere fra signifikansen av en korrelasjon?
Ved å undersøke p-verdien kan vi konkludere med hvorvidt vi kan forkaste nullhypotesen eller ikke. Nullhypotesen vil være at det ikke er noe forhold mellom variablene. Hvis p-verdien er signifikant, forkaster vi nullhypotesen og beholder den alternative hypotesen om at det er et forhold mellom variablene. Da kan man for eksempel si at det en sammenheng mellom stress og søvnkvalitet, men vi kan ikke si at stress påvirker søvnkvalitet eller motsatt. Det er fordi korrelasjon ikke er det samme som kausalitet.
Så kort fortalt kan vi konkludere med at det er en sammenheng mellom to variabler hvis korrelasjonen er signifikant, men vi kan ikke si noe om kausalitet.
Hva er forskjellen mellom korrelasjon og årsakssammenheng?
At to fenomener korrelerer eller samvarierer betyr ikke nødvendigvis at det foreligger kausalitet. For eksempel kan det være bakenforliggende faktorer som forklarer begge fenomenene.
Korrelasjon oppsummerer hvordan to faktorer (variabler) beveger seg sammen, f.eks. korrelasjonen mellom høyde og vekt. Kausalitet handler om årsak og virkning, altså at iskremsalget øker på sommeren da det er varmere.
Hva kan partiell korrelasjon brukes til?
Partiell korrelasjon er en statistisk teknikk som brukes til å måle sammenhengen mellom to variabler, samtidig som det kontrolleres for effekten av en eller flere andre variabler som kan påvirke forholdet mellom de to hovedvariablene. Den brukes vanligvis i sammenhenger der det er nødvendig å isolere og vurdere sammenhengen mellom to variabler uten å bli forstyrret av potensielle tredjepartsfaktorer.