Thema 4 Flashcards by Nicky deWeille

Correlatie analyse

analyse methode voor het verband tussen twee variabelen

How well did you know this?

Not at all

Perfectly

positief verband op scatterpot

betekent dat, naarmate de waarde van de variabele op de x-as toeneemt, of afneemt, de waarde van de variabele op de y-as ook toeneemt of afneemt

How well did you know this?

Not at all

Perfectly

Bij een negatief verband geldt

dat onderzoekseenheden die hoger scoren op de variabele op de x-as, juist lager scoren op de variabele op de y-as en andersom

How well did you know this?

Not at all

Perfectly

Correlatie coëfficiënt/correlatie/Pearson’s R

drukt uit hoee sterk twee continue variabelen (minimaal interval niveau) met elkaar samenhangen

How well did you know this?

Not at all

Perfectly

Als iemand op een variabele ver boven het gemiddelde scoort en op een andere variabele ook, draagt die persoon bij aan een positief verand

(beide variabelen onder gemiddelde betekent ook een positief verband)
Personen die op de ene variabele boven en op de andere variabele onder het gemiddeld scoren, dragen bij aan een negatief verband

punt dat verder van het gemiddelde af ligt heeft meer invloed op het verband tussen 2 variabelen dan punten die dichter bij het gemiddelde gemiddelde liggen

How well did you know this?

Not at all

Perfectly

Vermenigvuldigde afwijkingen optellen en delen door het aantal datapunten-1

som delen we door het aantal datapunten -1 (aantal vrijheidgrafden = covariantie

Covariantie = maat voor de spreiding die twee datareeksen delen

Covariantie drukt uit hoeveel variantie de twee variabelen x en y met elkaar delen.
Een variabele deelt 100% van de variantie met zichzelf, dus de covariantie van x met x is de variantie (ofwel Mean Squares/MS)

de formule voor de variantie en covariantie zijn hetzelfde; de variantie is de “covariantie van een variabele met zichzelf”
nadeel van deze maat = afhnakelijkheid van de meetschalen waarop 2 variabelen gemeten zijn (dit maakt de covariantie onvergelijkbaar tussen studies)

How well did you know this?

Not at all

Perfectly

Covarianties corrigeren voor de schaalverdelingen van de gebruikte operationalisaties door te delen door de standaarddeviatie (dit elimineert schaalafhankelijkheid)

Bij standaardisering van scores wordt van elk datapunt het gemiddelde afgetrokken, waarna dat verschil wordt gedeeld door de standaarddeviatie. De nieuwe reeks datapunten heeft een gestandaardiseerde schaal, waarbij gemiddelde 0 is en 1 staat voor 1 standaarddeviatie

covariatie/standaarddeviatie = correlatiecoëfficiënt

correlatiecoëfficiënt
0 = gebrek aan verband
-1 = perfecte negatieve samenhang
1 = perfecte positieve samenhang

How well did you know this?

Not at all

Perfectly

Scatterplot lineair

goed verband variabelen
- curvilineair = correlatie kan het verband niet samenvatten

How well did you know this?

Not at all

Perfectly

Correlatie

= effectmaat (een groep statistische maten die aangeeft hoe sterk een verband is op een schaal verdeling onafhankelijk van de gebruikte operationalisaties
- de sterkte van het verband = effect grootte/effect size
(verband van r.50 is altijd even groot)

How well did you know this?

Not at all

Perfectly

Interpretatie - 3 dingen

1) interpretatie van hoe sterk variabelen samenhangen is subjectieve aangelegenheid

2) correlatie zegt niet over causaliteit

3) correlaties zijn puntschattingen die worden berekend op basis van steekproeven

How well did you know this?

Not at all

Perfectly

Betrouwbaarheidsintervallen berekenen op basis van de steekproevenverdeling.

Voor de correlatie gebruiken we de steekproevenverdeling van Pearson’s R

How well did you know this?

Not at all

Perfectly

Net zoals de steekproevenverdeling van het gemiddelde alle mogelijke gemiddelden bevat die je in een steepfroef van een gegeven omvang kunt vinden

bevat de steekproevenverdeling van de correlatie alle correlaties die je in een steekproef van een gegeven omvang kunt vinden.

steekproevenverdeling is afhankelijk van de populatiecorrelatie en het aantal datapunten (steekproefomvang)

How well did you know this?

Not at all

Perfectly

Verschil tussen de steekproevenverdeling van de correlatie en de steekproevenverdeling van de beschrijvingsmaten.

De correlatie kan nooit buit het interval van -1 tot 1 liggen.
Afwijkingen van de populatiecorrelatie komen door toeval (steeproef- en meetfout)
Als de populatiecorrelatie dichtbij -1 of 1 ligt, is de kans dat door toeval de steekproefcorrelatie nog dichterbij -1 of 1 ligt een stuk kleiner dan dat de steekproef correlatie dichter bij 0 ligt.
Daarom wordt de steekproevenverdeling asymmetrisch naarmate de populatiecorrelatie dichter in de buurt van -1 of 1 komt.

(de steekproevenverdeling van het gemiddelde is symmetrisch)
- hoe kleiner de steekproef, hoe breder de steekproevenverdeling

How well did you know this?

Not at all

Perfectly

Betrouwbaarheidsintervallen hebben een betrouwbaarheid;

deze geeft aan hoe vaak de corresponderende populatiewaarde in het interval zal liggen, als de steekproef oneindig vaak herhaald zou worden

100% Betrouwbaarheidsinterval bevat altijd de popuatiewaarde en is daarom oneindig breed
0% betrouwbaarheidsinterval bevat nooit de populatiewaarde en heeft daarom een breedte van 0 (= slechts 1 getal oftewel punt: de puntschatting)
95% wordt meeste gebruikt. hierbij zal in 95% van de steekproeven de populatie correlatie in het betrouwbaarheids interval van de steekproef correlatie liggen

How well did you know this?

Not at all

Perfectly

Nulhypothese drukt uit wat je verwacht tee vinden als de theoretische voorpselling niet klopt

het beschrijft een situatie waarin er geen verband bestaat

How well did you know this?

Not at all

Perfectly

P-waarde

Study These Flashcards

de kans op een gegeven puntschatting (of een extremere waarde) als die uit een gegeven steekproeven verdeling afkomstig zou zijn

P-waarde kunnen we alleen uitrekenen onder de aanname dat de nulhypothese waar is. De populatiewaarde van de correlatie is dan gelijk aan de waarde van de correlatie volgens de nulhypothese R=0

(onder de aanname dat nulhypothese waar is)
- de kans op correlatie (-0.23) hoger dan kans op correlatie .71 (deze kansen zijn p-waarden en de percentages deel je door 100 en daarna verdubbelen)

De p-waarde is een funcctie van de sterkte van het verband (pearson’s r) end e steekproefomvang. Als de steekrpoefomvang toeneemt, daalt de P-waarde voor een gegeven verband
P-waarde is significant als hij lager is dan .05

Een significatie uitkomst, ofte wel een P-waarde onder de .05 bij een alpha van .05

Study These Flashcards

betekent dat onder de nulhypothese (r=0) de kans op de steekproef correlatie kleiner is dan 5%
(de redenering is dat het wel heel toevallig zou zijn als in deze steekproef, puur door steekproeftoeval en meetfout, zo’n uitzonderlijk extreme correlatie gevonden zou worden)

Alpha

Study These Flashcards

het significatieniveau. Geeft de maximale kans weer dat je de nulhypothese ten onrechte verwerpt

Type 1 Fout

Study These Flashcards

wordt gemaakt als de nulhypothese wordt verworpen, dus alls er wordt geconcludeerd dat er in de populatie een verband bestaat terwijl dit eigenlijk niet zo is

(bij eeen alpha van .25 gebeurt dit in 25% van de getrokken steekproeven uit een populatie waar het betreffende verband niet bestaat)
- de kans op een type 1 fout kan alleen worden verlaagd door een lagere alpha te kiezen
- bij ene alpha van .05 (de conventie in psychologie) wordt in 5% van de gevallen waarin een p-waarde wordt gebruikt om conclusies te trekken over een populatie een type 1 fout gemaakt (1 op 20)

NHST (Nul Hypothese Significanatie Toets)

Study These Flashcards

per definitie is de kans dat een willekeurige correlatie in de laagste 2,5% van de steekproevenverdeling ligt, 2,5%.
De kans dat een willekeurige correlatie (dwz een correlatie uit een willenkeurige steekproef) in de hoogste 2,5% van de steekproevenverdeling ligt is ook per definitie 2,5%.
Dit betkent dat de kans dat een willekeurige correlatie in de extreemste 5% van de steekproevenverdeling ligt, gelijk aan 5%.

Type 2 Fout

Study These Flashcards

Ten onrechte de nuhypothese aanhouden
- nadeel NHST: als de alpha lager is wordt de kans op een type1 fout kleiner, maar de kans op een type 2 fout groter. Oplossing: steekproefomvang vergroten

Power (van de nulhypothesetoets)

Study These Flashcards

de kans dat we een verband van een bepaalde omvang kunnen detecteren, aangenomen dat deze echt bestaat

als daadwerkelijke populatiecorrelatie groter is, wordt power groter
lager wanneer de daadwerkelijke steekproefcorrelatie dichterbij in de buurt van onze nulhypothesecorrelatie ligt

Power

Study These Flashcards

Voordat wetenschappers data gaan verzamelen, moeten ze eerst berekenen hoe groot de steekproef moet zijn.
Als er een NHST wordt gebruikt, wordt dit gedaan met zogenaamde powerberekeningen.
Hiervoor is wel een aanname nodig, namelijk die van de daadwerkelijke populatiecorrelatie; men moet goed nadenken over hoe sterk het verband is dat ze hopen aan te tonen + hoe groot de gewenste kans op succes is

studies met te weinig deelnemers zijn underpowered; in deze studies is de kans klein om de nulhypothese te kunnen verwerpen bij een daadwerkelijkeverband in de populatie
elke p-waarde drukt de kans uit dat de bijbehorende (of een extremere) steekproef correlatie wordt gevonden

Binnen NHST wordt de p-waarde vergeleken met de gekozen alpha (vaak 5%) om te besluiten of het waarschijnlijk is dat de bijbehorende variabelen in de populatie samenhangen

Study These Flashcards

voor elke p-waarde is de kans dat een typ 1 fout gemaakt wordt gelijk aan 5%

Elke extra p-waarde die een onderzoeker uitrrekent, verhoogt de kans op een type 1 fout, of als de onderzoeker hiervoor corrigeert, de kans op een type 2 fout.

De enige oplossing is meer deelnemers onderzoeken; dan worden de steekproevenverdelingen smaller, waardoor de kans op een type 2 fout daalt en de power dus acceptabel blijft, terwijl de correctie van de p-waarde de kans op een type 1 fout beperkt

Bonferroni (multiple testing)

elke p-waarde wordt vermenigvuldigd met het aantal p-waarden dat in totaal wordt berekend.

Een puntschatting is een getal dat berekend wordt uit de steekproef, bijv. het gemiddelde, de standaarddeviatie, de scheefheid of de correlatie.

Maar de steekproef is slechts een instrument om iets te kunnen zeggen over de populatie om iets te kunnen zeggen over de populatie. Schattingen uit steekproeven worden beïnvloed door toeval, zoals steekproeftoeval en meetfout. Een puntschatting uit een steekproef is nooit exact hetzelfde als de populatiewaarde; de puntschatting wijkt altijd af, soms in decimalen en soms heel sterk.

Door de standaarfout van de steekproevenverdeling waar de puntschatting uitkomt te berekenen, krijgen we een indruk van hoe dicht de puntschatting in de buut ligt van de corresponderende populatie waarde;

dit wordt gedaan door een betrouwbaarheidsinterval op te stellen. De betrouwbaarheid van dat interval geeft aan in hoeveel procent van de steekrpoeven de populatiewaarde in het interval zal liggen Bij een 95% betrouwbaarheidsinterval ligt de populatiewaarde in 95 van de 100 steekproeven in nhet betrouwbaarheidsinterval.

Correlatieanalyse uitvoeren

1) variabelen bekijken (density - Q-Q - boxplot) --> extreme outliers? 2) samenhang? coëfficiënt Pearson's R + P-waarde 3) Scatterplot

Thema 4 Flashcards

(29 cards)