Thema 4 Flashcards
Correlatie analyse
analyse methode voor het verband tussen twee variabelen
positief verband op scatterpot
betekent dat, naarmate de waarde van de variabele op de x-as toeneemt, of afneemt, de waarde van de variabele op de y-as ook toeneemt of afneemt
Bij een negatief verband geldt
dat onderzoekseenheden die hoger scoren op de variabele op de x-as, juist lager scoren op de variabele op de y-as en andersom
Correlatie coëfficiënt/correlatie/Pearson’s R
drukt uit hoee sterk twee continue variabelen (minimaal interval niveau) met elkaar samenhangen
Als iemand op een variabele ver boven het gemiddelde scoort en op een andere variabele ook, draagt die persoon bij aan een positief verand
(beide variabelen onder gemiddelde betekent ook een positief verband)
Personen die op de ene variabele boven en op de andere variabele onder het gemiddeld scoren, dragen bij aan een negatief verband
- punt dat verder van het gemiddelde af ligt heeft meer invloed op het verband tussen 2 variabelen dan punten die dichter bij het gemiddelde gemiddelde liggen
Vermenigvuldigde afwijkingen optellen en delen door het aantal datapunten-1
- som delen we door het aantal datapunten -1 (aantal vrijheidgrafden = covariantie
Covariantie = maat voor de spreiding die twee datareeksen delen
Covariantie drukt uit hoeveel variantie de twee variabelen x en y met elkaar delen.
Een variabele deelt 100% van de variantie met zichzelf, dus de covariantie van x met x is de variantie (ofwel Mean Squares/MS)
- de formule voor de variantie en covariantie zijn hetzelfde; de variantie is de “covariantie van een variabele met zichzelf”
- nadeel van deze maat = afhnakelijkheid van de meetschalen waarop 2 variabelen gemeten zijn (dit maakt de covariantie onvergelijkbaar tussen studies)
Covarianties corrigeren voor de schaalverdelingen van de gebruikte operationalisaties door te delen door de standaarddeviatie (dit elimineert schaalafhankelijkheid)
Bij standaardisering van scores wordt van elk datapunt het gemiddelde afgetrokken, waarna dat verschil wordt gedeeld door de standaarddeviatie. De nieuwe reeks datapunten heeft een gestandaardiseerde schaal, waarbij gemiddelde 0 is en 1 staat voor 1 standaarddeviatie
covariatie/standaarddeviatie = correlatiecoëfficiënt
correlatiecoëfficiënt
0 = gebrek aan verband
-1 = perfecte negatieve samenhang
1 = perfecte positieve samenhang
Scatterplot lineair
goed verband variabelen
- curvilineair = correlatie kan het verband niet samenvatten
Correlatie
= effectmaat (een groep statistische maten die aangeeft hoe sterk een verband is op een schaal verdeling onafhankelijk van de gebruikte operationalisaties
- de sterkte van het verband = effect grootte/effect size
(verband van r.50 is altijd even groot)
Interpretatie - 3 dingen
1) interpretatie van hoe sterk variabelen samenhangen is subjectieve aangelegenheid
2) correlatie zegt niet over causaliteit
3) correlaties zijn puntschattingen die worden berekend op basis van steekproeven
Betrouwbaarheidsintervallen berekenen op basis van de steekproevenverdeling.
Voor de correlatie gebruiken we de steekproevenverdeling van Pearson’s R
Net zoals de steekproevenverdeling van het gemiddelde alle mogelijke gemiddelden bevat die je in een steepfroef van een gegeven omvang kunt vinden
bevat de steekproevenverdeling van de correlatie alle correlaties die je in een steekproef van een gegeven omvang kunt vinden.
- steekproevenverdeling is afhankelijk van de populatiecorrelatie en het aantal datapunten (steekproefomvang)
Verschil tussen de steekproevenverdeling van de correlatie en de steekproevenverdeling van de beschrijvingsmaten.
De correlatie kan nooit buit het interval van -1 tot 1 liggen.
Afwijkingen van de populatiecorrelatie komen door toeval (steeproef- en meetfout)
Als de populatiecorrelatie dichtbij -1 of 1 ligt, is de kans dat door toeval de steekproefcorrelatie nog dichterbij -1 of 1 ligt een stuk kleiner dan dat de steekproef correlatie dichter bij 0 ligt.
Daarom wordt de steekproevenverdeling asymmetrisch naarmate de populatiecorrelatie dichter in de buurt van -1 of 1 komt.
(de steekproevenverdeling van het gemiddelde is symmetrisch)
- hoe kleiner de steekproef, hoe breder de steekproevenverdeling
Betrouwbaarheidsintervallen hebben een betrouwbaarheid;
deze geeft aan hoe vaak de corresponderende populatiewaarde in het interval zal liggen, als de steekproef oneindig vaak herhaald zou worden
- 100% Betrouwbaarheidsinterval bevat altijd de popuatiewaarde en is daarom oneindig breed
- 0% betrouwbaarheidsinterval bevat nooit de populatiewaarde en heeft daarom een breedte van 0 (= slechts 1 getal oftewel punt: de puntschatting)
- 95% wordt meeste gebruikt. hierbij zal in 95% van de steekproeven de populatie correlatie in het betrouwbaarheids interval van de steekproef correlatie liggen
Nulhypothese drukt uit wat je verwacht tee vinden als de theoretische voorpselling niet klopt
het beschrijft een situatie waarin er geen verband bestaat