6 - Korrelasjonsanalyse Flashcards
Beskriv hovedmålene med korrelasjonsanalyse. Hvordan kan vi kvantifisere en korrelasjon?
En korrelasjonsanalyse har som mål å kvantifisere statistiske forholdet mellom to variabler. Statiske forhold beskriver hvordan endring i en variabel er relatert til endring i en annen variabel, og korrelasjonsanalysen hjelper oss å kvantifisere denne samvariasjonen/korrelasjonen. Korrelasjon oppgis gjerne i Persons r som er en kvantifisering av det statiske forholdet. Jo tydeligere forholdet er, jo sterkere er korrelasjonen. Korrelasjon uttrykkes gjerne som et tall mellom -1 og 1.
Hva betyr det at en korrelasjon er positiv eller negativ?
Korrelasjonen kan være enten positiv eller negativ. En positiv korrelasjon viser til en positiv relasjon. De to variablene endrer seg i samme retning. En negativ korrelasjon viser til en negativ relasjon. De to variablene endrer seg i ulike retninger. En korrelasjon på -1 utrykker en perfekt negativ korrelasjon og en korrelasjon på 1 utrykker en perfekt positiv korrelasjon. En korrelasjon på 0 indikerer ingen samvariasjon mellom variablene.
Hva er kovarians? Hvordan er det forskjellig fra varians?
Varians forteller oss hvor mye hver verdi avviker fra gjennomsnittet. Men kovarians noe om forholdet mellom avvikene fra sine respektive gjennomsnitt to variabler har.
Hva betyr det at kovarians er negativ eller positiv? Og hva slags verdi kan kovarians ha, og hva slags betydning har den?
Hvorvidt kovarians er positiv eller negativ forteller oss noe om retningen på forholdet mellom variablene, og kovarians kan ha hvilken som helst verdi, den er ikke begrenset til å være mellom -1 og 1. Verdien til kovarians har ikke en standardisert skala, og verdien er avhengig av måleenhetene til variablene, og derfor er det ikke slik at verdien til kovarians alltid sier noe om styrken på forholdet fordi det kommer ann på hvilken måleenhet som er brukt på variablene.
Hva representerer Persons produkt-moment korrelasjonskoeffisient?
Fordi verdien til kovarians blir i stor grad påvirket av måleenheten, så har man kommet fram til et standardisert mål for kovarians, og dette målet er Persons korrelasjonskoeffisient r. Pearsons r reflekterer det lineære forholdet mellom to variabler, og det blir ikke påvirket av måleskalaene. Det regnes ut ved å dele kovarians på produktet av standardavvikene for de to variablene.
Pearsons r kan variere fra -1 og 1, der 0 indikerer ingen korrelasjon, og 1 og -1 reflekterer perfekt positiv og negativ korrelasjon. Persons r representerer også effektstørrelse og tommelfingerregelen her er at r rundt 0.1 reflekterer en svak effekt, r på 0.3 reflekterer en moderat effekt og r på 0.5 eller høyere reflekterer en stor effekt.
Hvordan kan vi teste signifikansen til en korrelasjon?
Vi kan teste signifikansen til en korrelasjon ved å gjøre Pearsons r om til en t-skår ved å bruke en spesiell formel. Da kan vi teste om t-skåren er signifikant forskjellig fra 0, og hvis vi får en p-verdi mindre en .05, så forkaster vi nullhypotesen, og vi konkluderer med at korrelasjonen er signifikant.
Hva kan vi konkludere med fra signifikansen av en korrelasjon?
Ved å undersøke p-verdien kan vi konkludere med hvorvidt vi kan forkaste nullhypotesen eller ikke. Nullhypotesen vil være at det ikke er noe forhold mellom variablene. Hvis p-verdien er signifikant, forkaster vi nullhypotesen og beholder den alternative hypotesen om at det er et forhold mellom variablene. Da kan man for eksempel si at det en sammenheng mellom stress og søvnkvalitet, men vi kan ikke si at stress påvirker søvnkvalitet eller motsatt. Det er fordi korrelasjon ikke er det samme som kausalitet.
Så kort fortalt kan vi konkludere med at det er en sammenheng mellom to variabler hvis korrelasjonen er signifikant, men vi kan ikke si noe om kausalitet.
Hva er forskjellen mellom korrelasjon og kausalitet?
Korrelasjon beskriver om det er et statisk forhold mellom to variabler. For eksempel kan man si at det er en sammenheng mellom å stresse mye og å sove dårlig. Men kausalitet handler om forholdet mellom årsak og virkning. Når vi har kausalitet vet vi at en variabel (årsak) forårsaker en annen variabel (virkning). Det ville for eksempel være å si at mye stress gjør at man sover dårlig, og dette kan man ikke si noe om på bakgrunn av en korrelasjonsanalyse. Gjennom en korrelasjonsanalyse kan vi bare konkludere med hvorvidt det er en korrelasjon, altså om variablene har en samvariasjon.
Grunnen til at man ikke skal si noe om kausalitet basert på korrelasjon er blant annet retningsproblemet. Vi vet ikke om det er x som påvirker y, eller y som påvirker x. I tillegg handler det også om forstyrrende variabler, som betyr at det kan være en tredje variabel som påvirker variablene i analysen.
Hva kan partiell (delvis) korrelasjon bli brukt for?
Når man gjennomfører en partiell korrelasjonsanalyse undersøker man korrelasjonen mellom to variabler etter å ha fjernet effekten av en tredje eller flere variabler. Dette gjøres ved å holde den tredje, forstyrrende variabelen konstant. På denne måten kan man kontrollere for om samvariasjonen av de to opprinnelige variablene faktisk kan tilskrives hverandre, eller om de eventuelt må tilskrives en tredje variabel. Et eksempel på dette kan være at noen sier at barn med store stortær have bedre språkferdigheter. Og at en studie fant en sterk korrelasjon mellom språkferdigheter og størrelsen på stortåen i et utvalg av barn. Men dette burde ikke vært en overraskelse hvis du blir fortalt at barna som ble testet varierte i alder fra 12 måneder til 12 år, så alder kan være en forstyrrende variabler her. Ved å utføre en partiell korrelasjon mellom tåstørrelse og språkferdigheter fikk man ikke lenger en korrelasjon mellom variablene.
Så kort fortalt kan partiell korrelasjon mellom to variabler bli brukt for å fjerne den forstyrrende effekten av en tredje eller flere variabler på de andre variablene.