College 2 Flashcards
Uit welke stappen bestaat fase 1 van de analyse: data screening? 4x
- Missing values
- Datainvoerfouten
» Descriptives»_space; Kijk naar minimum en maximum om te kijken of daar gekke getallen in staan die buiten de reeks vallen van die variabele.
»> Kijk of er te veel of te weinig condities zijn. Dan kun je kijken of de codering goed is gegaan. - (Univariate) outliers
- Normaliteit
Uit welke stappen bestaat fase 2 van de analyse: toetsing? 4x
- Toetskeuze
- Assumpties checken
- Toetsen
- Effectgrootten
Welke 3 vragen moet je jezelf stellen bij fase 3 van de analyse: statistische conclusies en interferenties?
- Wat zegt de ddata?
- Wat zijn de conclusies in mensentaal?
- Alternatieve verklaringen
Wat zijn de manieren om invoerfouten te checken? 3x
- Frequencies:
> Analyze > Descriptive statistics > frequencies > groepen toevoegen > check of de groepen kloppen - Descriptives
- Min-max
Wat zijn de manieren om outliers te checken? 3x
- Z-scores (z>3.29 = meest moderne criterium)
!!! Kijk per conditie. - Boxplots (IQR>3)
> Graphs > Legacy diaglogs > boxplots. Bij IQR>3 wordt de datpoint een sterretje. Bij IQR>1,5 wordt de datapoint een bolletje.
!!! Per condities checken of er outliers zijn. - Cook’s distance (niet nodig in deze cursus)
*Allemaal voor- en nadelen. De een is niet beter dan de ander.
Wat zijn de manieren om de dataverdeling te checken? 4x
- PP-QQ
- Boxplots/histogram
- Skewness/kurtosis
- KS/SW
Wat betekent robuust?
Levert resultaten op die niet snel veranderen als iets van een assumptie niet snel geschonden wordt.
(Bijv. box-plots zijn niet gevoelig dus niet robuust, maar z-scores wel)
Wat betekent een z-score van 0?
Betekent dat je score gelijk is aan het gemiddelde.
Hoe check je de verdeling?
- Analyze
- Descriptive statistics
- Explore
- Afhankelijke variabele in ‘dependent list’ toevoegen, en onafhankelijke variabelen in de ‘factor list’ toevoegen.
- Bij ‘plots’ de ‘normality plots with tests’ aanklikken.
- Check waarde ‘Skewness’, deze moet tussen -3 en 3 liggen. Of tussen -1 en 1 als je strengere criteria wil aanhouden. Tussen die waardes is het niet scheef.
Deze heeft grootte impact op de power. - Check waarde ‘Kurtosis’ Deze moet tussen -3 en 3 liggen. Dan is de verdeling niet scheef.
Als Kurtosis extreem is, maar Skewness niet, dan is het niet erg. - Kijk naar waarde ‘Kolmogorow-Smirnov’ en ‘Shapiro-Wilk’.
Als deze niet significant is, dan verschilt de data niet significant van een normaal verdeling. Dus er is dan een normaalverdeling.
Dus de assumptie van de normaalverdeling is dan niet geschonden.
Wat is het gevolg van het schenden van assumpties?
Dan heb je minder power, dus minder snel significante verschillen.
Benoemen in de discussie.
Als de normaalverdeling assumptie wordt geschonden, kun je daar eigenlijk niets tegen doen. Ga niet met gekke trucjes de data lopen manipuleren, want tenzij je precies weet wat je doet, wordt het moeilijker om de data te interpreteren.
Wat doen als je outliers vindt?
Deze uit de analyse filteren (zie bijeenkomst 2 rond 1 uur) en kijken hoe het de resultaten beïnvloedt.
Zet in verslag welke criteria je hanteert!!
Hoe voer je ANOVA In SPSS?
- Analyze
- General Linear model (dit is de eigenlijke naam van ANOVA)
- Univariate (= 1 Y; multivariate betekent meerdere Y’s).
In deze cursus gebruiken we alleen univariate of repeated measures, afhankelijk van wat je gaat doen. - Afhankelijke variabele bij ‘dependent varaible’, en onafhankelijke variabelen bij ‘fixed factors’.
- Ga naar ‘options’ en klik aan:
- Descriptive statistiscs (dubbele check data)
- Estimates of effect sizes
- Homogeneity tests (Levene test, om te checken of iedere groep dezelfde spreiding heeft).
»Kijk bij de Levene test naar de bovenste rij! - Bij interactie effecten is het fijn om ook plots te maken om de data visueel te maken. Ga naar ‘plots’ en zet de belangrijkste variabele op de horizontale as en de andere bij ‘seperate lines’. Klik op ‘add’ en klik error bars aan.
- Bij ‘EM means’ de interactie tussen variabelen toevoegen. Dan krijg je ook getallen bij de interactie.
- Paste
- Kijk naar descriptive statistics. Gekke getallen?
- Kijk naar Levene’s test. Bovenste rij. Aan assumptie van homogeniteit van varianties voldaan?
- Hoofdeffecten.
Kijk naar resultaat ANOVA bij ‘Tests of between-subjects effects’. Indien significant, dan betekent het dat tenminste één groep significant verschilt van tenminste één andere groep, maar je weet nog niet welke groepen verschillen.
Kijk naar ‘Partial eta squared’ om te kijken of het significante verschil boeit. Bijv. als partial eta squared 0,271 is, dan betekent dat dat 27.1% van alle verschillen in uitkomst afhankelijke variabele kunnen we toeschrijven aan verschil in conditie. 0,10 is al sterk. - Kijk naar grafieken.
- Interactie-effecten.
Kijk naar pairwise comparisons dependent variabele.
Welke verschillen zijn significant?
Wat betekent het als de Levene’s test (assumptie van homogeniteit van varianties) niet significant is?
Geen verschil > wat verschilt niet > de varianties van de groepen.
Hoe weet je of de interactie medierend of modererend is?
Een moderatie is een interactie.
Een mediatie kan nooit een interactie zijn. A zet B in gang, en B zet C in gang.
Of iets een moderator zijn, hangt ook van de theorie af. Alle moderaties zijn interacties, maar niet alle interacties zijn moderaties.
Interacties is een statistisch begrip, terwijl een moderatie een theoretisch begrip is.