thema 3 repeated measures designs Flashcards
repeated measures design, ANOVA is een statistische methode om herhaalde metingen van een continue, normaal verdeelde afhankelijke variabele te analyseren. Deze methode is te gebruiken als de afhankelijke variabele op een beperkte aantal vaste tijdstippen is gemeten en waarbij alle deelnemers op alle tijdstippen gemeten zijn.
voorwaarden:
3+ meetmomeneten bij dezelfde proefpersonen
proefpersonen ondergaan alle condities
In thema 3 worden de herhaalde metingen behandeld. Net als bij een gepaarde t-toets gaat het bij herhaalde metingen om het verschil tussen gemiddelden van metingen die aan elkaar gerelateerd zijn. Bij drie of meer meetmomenten gebruikt u een herhaalde-metingenanalyse.
Metingen kunnen om diverse redenen aan elkaar gerelateerd zijn:
-dezelfde meting wordt verricht bij deelnemers die bij elkaar horen, bvb een gezin als onderzoekseenheid en metingen bij zzowel ouders als kinderen. deze metingen kunnen metelakar vergeleken worden.
-metingen van varibelen die verricht zijn bij eenzelfde persoon
-herhaalde metingen op verschillende tijdstippen bij een groep van personen.
Afhankelijk van de onderzoeksvraag kan het wenselijk zijn om in plaats van op één moment (crosssectioneel) over meerdere momenten (herhaalde) metingen te verrichten naar bijvoorbeeld aantrekkingskracht of productiviteit. Deze data zullen met behulp van een herhaalde-metingenanalyse geanalyseerd moeten worden.Wanneer u de verschillen in scores met gepaarde t-toetsen zou analyseren, zijn er bijvoorbeeld drie gepaarde t-toetsen nodig (meting 1 vergeleken met meting 2, meting 2 vergeleken met meting 3 en meting 1 vergeleken met meting 3) waardoor er kanskapitalisatie ontstaat.
U kunt de herhaalde-metingenanalyse ook gebruiken om een voor- en een nameting van een experiment te vergelijken. Het voordeel van de herhaalde-metingenanalyse is in dit geval dat u geen verschilscore hoeft te berekenen. De output van de herhaalde meting is echter wel wat complexer.
Bij herhaalde metingen gaat het om de within-groups variance en de between-groups variance, net als bij de variantieanalyse. Uiteraard is er een verschil met de variantieanalyse, want bij herhaalde metingen gaat het niet om metingen binnen groepen maar om metingen binnen individuen. Het gaat dus niet om de individuele variatie binnen groepen en om de variatie tussen groepen, maar om de individuele variantie binnen individuen en om de variatie tussen metingen.
de assumptie sphericity
is een specifieke aanname voot een repated meusures ANOVA en kan gelinkt worden aan de assumptie van homogeniteit van variantie in between-groups designs. Het verwijst dus naar de gelijkheid van de varianties van de verschilscores tussen groepen,
Bij een herhaalde meting met 3 of meer meetmomenten wordt automatisch een Mauchly’s test toegevoegd in SPSS om te bepalen of er spreke is van shericity. Als deze significant is is de voorwaarde van een repeated measures ANOVA geschonden.
Zorgt voor een verlies aan power en een F-statistiek die niet de distributie heeft die hij zou moetyen.
Als de aanname geschonden wordt, is de bonferroni correctie het meest robuust.
Als de aanname zeker niet geschonden is kan TUkey’s test gebruikt worden
Sphericity kan op veel manieren berekend worden, wat resulteert in een waarde die 1 is wanneer de data spherisch zijn en minder dan 1 wanneer ze dat niet zijn. De vrijheidsgraden van een geschonden F-statistiek kan men dan vermenigvuldigen om de F- statistiek conservatiever en minder vatbaar voor type-1fouten te maken.
Als Mauchly’s test significant is, bekijk dan de greenhouse-Geisser of Huynh-Feldt schattingen van sphericity:
-Greenhouse-geisser sphericity >.75: gebruik de Huynh-Feldt correctie
Greenhouse- Geisser sphericity <.75: Greenhouse- Geisser correctie
De F-statistiek voor repeated meusures designs
Opgelet! bij repeated measures heeft de F betrekking op individuen. F geeft de verhouding van verklaarde tegen onverklaarde variantie weer, oftewel het experomenteel effect binnen het individu.
In een repeated measures design toont het effect van een experiment (de onafhankelijke variabele) zich in de within participant variantie (eerder dan in de between-group variantie).
Herhaling: bij onafhankelijke designs is de within-participant variantie de SSr residual sum of squares: de variantie ten gevolge van individuele verschillen in performance. Echter bij experimentele manipulatie op dezelfde entiteiten zal de within-participant variantie niet enkel de individuele verschillen in variantie bevatten, maar ook de effecten van de manipulatie. Bij repated measures designs kijkt men voor het experimenteel effect (SSm model sum of squares) dus eerder binnen het individu dan binnen de groep.
De varianties zijn dezelfde als bij onafhankelijke designs: SSt total sum of squares, SSm model sum of squares en SSr residual sum of squares HET VERSCHIL ZIT IN DE PLEK VAN DE VERSCHILLENDE SUMS OF SQUARES. bij repated measures designs zijn de model en residuel sum of squares onderdeel van de within-participant variantie.
SSm geeft aan hoeveel variantie verklaard word door het model en SSr hoeveel variantie gevolg is van andere factoren.
De F statistiek is de ratio van de variatie verklaard door het model en de variatie verklaard door onsystematische factoren. Zoals voor onafhankelijke designs de SSm model mean squares gedeeld door de SSr residual mean squares.
F = variantie manipulatie/ variantie fouten F= MSm/MSerror
conclusie one way repeated meauseres anova
De hypothese was dat het gebruik van de sportzaal na de voorlichting zal toenemen en na twee maanden verder toegenomen is. Conform de hypothese was er een significant hoofdeffect voor sportverandering, F(1.8, 194.5) = 33.07, p < .001, partial η2 = .24. Zo’n 24% van de totale spreiding op het gebruik van de sportzaal kon verklaard worden door het meetmoment. Uit de repeated contrasten blijkt dat het gemiddelde gebruik van de sportzaal ten tijde van de eerste meting (M = 2.37; SD = 0.98) lager was dan ten tijde van de tweede meting (M = 2.63; SD = 1.17), F(1,107) = 14.73, p < .001, partial η2 = .12. Het gemiddelde gebruik van de sportzaal ten tijde van de tweede meting was lager dan ten tijde van de derde meting (M = 3.04; SD = 1.04), F(1,107) = 22.28, p < .001, partial η2 = .17.
NB: De hier gerapporteerde gemiddelden en standaarddeviaties heeft u in opdracht 3.1.8 al berekend. Alle ANOVA’s hebben bij Options een mogelijkheid om de descriptives op te vragen. In thema 2 en 3 maakt het geen verschil of u descriptives voor de analyse opvraagt (middels Descriptives of Explore) of met de analyse via Options -> [x] Descriptive Statistics.
Let erop dat in Thema 4 gemiddelden worden aangepast door een covariaat. Om deze aangepaste gemiddelden, Estimated Marginal Means genoemd, op te vragen dient u bij Options nog variabelen te plaatsen bij Display Means for:.
mixed designs anova’s
Na het bestuderen van deze studietaak kunt u
vraagstellingen en hypothesen voor Mixed Design ANOVA’s formuleren
interacties tussen between en within effects toetsen en interpreteren
de between-subject effects toetsen en interpreteren
Mixed Design ANOVA’s uitvoeren en de uitkomsten daarvan interpreteren
een effectgrootte van de Mixed Design ANOVA berekenen en interpreteren
een correcte techniek kiezen bij een vraagstelling
In thema 3.1 is de one-way herhaalde-metingen-ANOVA behandeld met behulp van hoofdstuk 15 uit Field (5e editie). Kern van die analyse is dat individuen gevolgd worden gedurende verschillende meetmomenten (of in verschillende condities zoals in Field beschreven). In de analyse zijn dat de within-subjects-factoren. In dit thema gaat u aan de slag met een factoriële herhaalde-metingen-ANOVA waarbij meerdere between-subjects-factoren een rol zullen gaan spelen. U volgt dan individuen over de tijd maar maakt naast voorlichting ook onderscheid op basis van leeftijd. Met twee between-subjects-factoren ontstaat er een factorieel ontwerp met een interactie-effect tussen de beide between-subjects-factoren. De output van de analyse wordt hierdoor wel een stukje complexer.
Belangrijk is om te onthouden dat within-subjects-effecten betrekking hebben op veranderingen tussen herhaalde metingen. De interactie-effecten die er zijn tussen de within-subjects-factoren en de between-subjects-factoren hebben dan ook betrekking hoe verschillen tussen herhaalde metingen kunnen verschillen per ‘groep’. De uitkomsten van de between-subjects-effecten hebben uitsluitend betrekking op de gemiddelde waarden voor deze within-subject factor(en).
mixed design ANOVA ; een design waarbij er een combinsatie is van onafhankelijke variabelen die gemeten zijn bij verschillende entiteiten en andere bij herhaalde metingen.
Dus minstens 2 onafh var en minstens 1 daarvan is gemeten bij dezelfde entiteiten en 1 daarvan over verschillende entiteiten.
bij de one-way herhaalde metingen ANOVA worden individuen gevolgd tijdens verschillende meetmomenten. In de analyse zijn dat within subjects factoren.
Bij een mixed design ANOVA gaan meerdere between subjects factoren een rol spelen, er gaat dan een interactie-effect spelen tussen de between–subjects factoren.
Within subjects effecten hebben betrekking op veranderingen tussen herhaalde metingen.
De interactie-effecten die er zijn tussen de within subjects factoren en de between subjects factoren hebben dan betrekkingen op hoe herhaalde metingen kunnen verschillen per groep.
de uitkomsten van de between-subjects effecten hebben uitsluiten betrekking op de gemiddelde waarden van deze within subjects factoren.
assumpties van de mixed design anova
- homogeniteit: de variantie van residuen is onafhankelijk van de onafhankelijke variabele, zelfs als de onafhankelijke variabele een ander niveau aanneemt, blijven de residuendezelfde variantie houden. Als Levene’s test p >0.05 dan is voldaan aan de aanname.
- shericity: verwijst naar de gelijkheid van de varianties van de verschilscores tussen groepen, oftewel het verschil tussen de verschillende niveau’s van de afhankelijke variabele. Als deze verschilscores ongeveer dezelfde variantie hebben, is de aanname niet geschonden. Als de aanname wel geschonden is zal de power kleiner worden en de kans op type 1 fouten toenemen.
Lees Maucly’s test voor sphericity - greenhouse geiser e >.75: gebruik de huynh- feldt correctie
e <.75 gebruik de greenhouse geisser correctie
contrasten
als de onafhankelijke variabele meer dan 2 niveaus heeft, kunnen er significante verschillen gezocht worden, maar bij een significant verschil is dan nog niet geweten welke groepen precies verschillen. Dit kan opgelost worden door contrasten op te stellen wanneer er al een specifieke hypothese voorhanden is.
Afhankelijk van de onderzoeksvraag kunnen er meerdere hypothesen zijn en dus ook meerdere contrasten.
post-hoc testen
kunnen uitgevoerd worden ter paarsgewijze controle wanneer er voorafgaand het experiment gen specifieke hypothese geformuleerd is.
multilevel analyse
Voor onderzoek met herhaalde metingen en biedt een alternatief wanneer aannames (homogeniteit, sphericity of normaliteit) worden geschonden.
De multilevel analyse kan steekproeven analyseren van hogere orde met meerdere niveau’s, bvb herhaalde metingen binnen personen, gemeten op verschillende dagen, meerdere keren per dag.
ook kan de analyse ontbrekende gegevens verwerken.
OOk hoef de onderzoeksopzet niet goed gebalanceerd te zijn, wat in de praktijk vaak zo is. Ook is de analyse in staat om met meeerdere soorten data om te gaan.
Multilevel analyse ksan variaties in de exacte timing van gegevensverzameling verwerken. Deze varitoe kan meegenomen worden in het voorspel model. Intervallen tussen meetpunten hoeven niet gelijk te zijn voor multilevel analyse.
Multilevelanalyse versus RM-ANOVA
Herhaaldelijke metingen (repeated measures) variantieanalyse (RM-ANOVA) wordt van oudsher gebruikt voor de analyse van onderzoeksopzetten met herhaalde metingen. Het schenden van de veronderstellingen van RM-ANOVA kan echter problematisch zijn. Een populaire analysetechniek, genaamd multilevelanalyse (MLA), wordt tegenwoordig vaak gebruikt voor analyses van herhaalde metingen omdat het een alternatieve benadering biedt voor het analyseren van dit type gegevens. Deze benadering kent verschillende voordelen ten opzichte van RM-ANOVA, die hieronder worden besproken.
MLA heeft minder strikte veronderstellingen: MLA kan worden gebruikt als de veronderstellingen van constante varianties (homogeniteit van de varianties of homoscedasticiteit), constante covarianties (compound symmetry) of constante varianties van de verschilscores (sphericity) worden geschonden voor RM-ANOVA. MLA maakt modellering van de variantie-covariantiematrix van dergelijke data mogelijk; dus, in tegenstelling tot RM-ANOVA, zijn deze aannames niet noodzakelijk.
MLA maakt een hiërarchische structuur mogelijk: MLA kan worden gebruikt voor steekproefprocedures van een hogere orde (bijvoorbeeld, personen, die worden gemeten op verschillende dagen en diverse keren binnen een dag), terwijl RM-ANOVA zich beperkt tot het onderzoeken van steekproefprocedures op twee niveaus (personen, gemeten op verschillende tijdstippen). Met andere woorden, MLA kan herhaalde metingen analyseren binnen personen, binnen een derde niveau van analyse enzovoort, terwijl RM-ANOVA beperkt is tot herhaalde metingen binnen personen.
MLA kan ontbrekende gegevens verwerken: ontbrekende gegevens zijn toegestaan in MLA zonder extra complicaties te veroorzaken. Met RM-ANOVA moeten gegevens van proefpersonen worden uitgesloten als er één datapunt ontbreekt. Ontbrekende gegevens en pogingen om met ontbrekende gegevens om te gaan (bijvoorbeeld door de ontbrekende gegevens ‘toe te voegen’, gebruikmakend van het gemiddelde van de niet-ontbrekende gegevens van de persoon), kunnen extra problemen met RM-ANOVA veroorzaken.
MLA kan ook gegevens verwerken waarin er variatie is in de exacte timing van de gegevensverzameling. De tijd tussen twee herhaalde metingen is bijvoorbeeld niet altijd hetzelfde. Gegevens voor een longitudinale studie kunnen bijvoorbeeld proberen metingen te verzamelen op de leeftijd van 6 maanden, 9 maanden, 12 maanden en 15 maanden. Deelnemersbeschikbaarheid, feestdagen en andere planningsproblemen kunnen echter leiden tot variatie in de momenten waarop gegevens feitelijk worden verzameld. Deze variabiliteit kan in MLA worden meegenomen in het voorspelmodel door ‘leeftijd’ toe te voegen aan de regressievergelijking. Het is ook niet noodzakelijk dat de intervallen tussen de meetpunten gelijk zijn in MLA.
Zowel RM-ANOVA als MLA veronderstelt dat de afhankelijke variabele continu is, en gemeten op een interval- of ratioschaal en dat de residuen normaal verdeeld zijn. Er zijn echter ook gegeneraliseerde lineaire modellen voor andere typen afhankelijke variabelen, zoals categorische, ordinale, discrete tellingen. Voor een van deze uitkomsten is ANOVA geen optie. Er is dus geen RM-ANOVA-equivalent voor ‘count’- of logistische regressiemodellen. MLA kan wel met dit soort data omgaan.
In tegenstelling tot MLA werkt RM-ANOVA niet goed wanneer de onderzoeksopzet niet gebalanceerd is, een situatie die in de praktijk zeer vaak voorkomt.
Conclusie
Als het ontwerp heel eenvoudig is en er zijn geen ontbrekende gegevens, dan leveren RM-ANOVA en een MLA waarschijnlijk identieke resultaten op. Bijvoorbeeld, een pre-post ontwerp (met slechts twee herhalingen) of een experiment met een enkele ‘between-subjects’-factor en een enkele ‘within-subjects’-factor. Als dat het geval is, is RM-ANOVA meestal prima. De flexibiliteit van MLA-modellen wordt belangrijker naarmate het onderzoeksontwerp gecompliceerder in elkaar steekt of wanneer er (veel) ontbrekende waarden zijn.
Multilevelanalyse wordt in deze cursus verder niet behandeld. Dit gebeurt wel in de cursus Onderzoekspracticum longitudinaal onderzoek.
sphericiteit bij repeated measures
Mauchly’s test van sphericiteit geeft aan dat de aanname voor sphericiteit geschonden is, (approx.chi-spuare in output)x2(2) = 13.28, p < .001. Omdat de Greenhouse-Geisser epsilon > .75 is (ɛ = .895) kan dit als een lichte schending van sphericiteit beschouwd worden, en wordt in de analyse gebruik gemaakt van de Huyn-Feldt correctie op de vrijheidsgraden.
antwoord op vraagstelling
Mogelijk antwoord:
De hypothese was dat het gebruik van de sportzaal na de voorlichting zal toenemen en na twee maanden verder toegenomen is. Conform de hypothese was er een significant hoofdeffect voor sportverandering, F(1.8, 194.5) = 33.07, p < .001, partial η2 = .24. Zo’n 24% van de totale spreiding op het gebruik van de sportzaal kon verklaard worden door het meetmoment. Uit de repeated contrasten blijkt dat het gemiddelde gebruik van de sportzaal ten tijde van de eerste meting (M = 2.37; SD = 0.98) lager was dan ten tijde van de tweede meting (M = 2.63; SD = 1.17), F(1,107) = 14.73, p < .001, partial η2 = .12. Het gemiddelde gebruik van de sportzaal ten tijde van de tweede meting was lager dan ten tijde van de derde meting (M = 3.04; SD = 1.04), F(1,107) = 22.28, p < .001, partial η2 = .17.
NB: De hier gerapporteerde gemiddelden en standaarddeviaties heeft u in opdracht 3.1.8 al berekend. Alle ANOVA’s hebben bij Options een mogelijkheid om de descriptives op te vragen. In thema 2 en 3 maakt het geen verschil of u descriptives voor de analyse opvraagt (middels Descriptives of Explore) of met de analyse via Options -> [x] Descriptive Statistics. Let erop dat in Thema 4 gemiddelden worden aangepast door een covariaat. Om deze aangepaste gemiddelden, Estimated Marginal Means genoemd, op te vragen dient u bij Options nog variabelen te plaatsen bij Display Means for:.