Les - One way anova Flashcards
ANOVA
ANALYSIS OF VARIANCE of variantie-analyse
= meerdere gemiddelden vergelijken
Doel van ANOVA
Onderzoekt de hoofd- en interactie-effecten van een categorische onafhankelijke variabele op een afhankelijke variabele op intervalniveau
test indien de gemiddelden van de door het OV gevormde groepen niet alleen toevallig verschillen - hangt af van
- de omvang van het verschil in gemiddelde
- de steekproefomvang in elke groep
- de variantie van de afhankelijke variabele
eenzijdige anova
= one way
verschillen in één interval AV tussen >2 groepen van één categorische OV
tweezijdige anova
- Verschillen in één interval AV tussen >2 groepen van twee categorische OV’s (waarvan de ene de andere controleert)
- 1 eerste orde interactie (AxB)
N-WAY Anova
- Verschillen in één interval AV tussen >2 groepen van n-categorische OV’s
- interacties van hogere orde interpretatiemoeilijkheden
Variantie:
= het gemiddelde van de kwadratische afwijkingen tov het gemiddelde (MS) of
= de som van de kwadratische afwijkingen tov het gemiddelde (SS) gedeeld door de vrijheidsgraden
Steekproefresiduen
= variatie data rond de steekproefgemiddelden
variantie binnen groep i - VUISTREGEL
ANOVA mag toegepast worden (onder de assumptie 1= …= p = ) als verhouding tussen grootste en kleinste si niet groter is dan 2
pooled variance
= Samengestelde schatter van de variantie
Totale kwadratensom (SST)
= variatie van de waarnemingen yij rond het totaal gemiddelde y00 (grand mean)
Tussen-groepen kwadratensom (SSB)
variatie van de groepsgemiddelden yi0rond het totaal gemiddelde y00 (grand mean)
Binnen-groepen kwadratensom (SSW)
variatie van de groepsgemiddelden rond het de waarnemingen yi0
Contrast
= combinatie van populatieverwachtingen
= Drukt een effect in de populatie uit als een combinatie van populatieverwachtingen
Deviatie-contrasten
= Elk niveau van de factor wordt vergeleken met het gemiddelde van alle andere niveaus.
Eenvoudige contrasten
Elk niveau van de factor (behalve het referentieniveau zelf) wordt vergeleken met het referentieniveau (hier laatste).
Herhaalde contrasten
Een herhaald contrast vergelijkt aangrenzende categorieën. Elke categorie van de voorspellende variabele of factor, behalve de eerste, wordt vergeleken met de categorie die eraan voorafgaat.
Polynomiale contrasten
In een polynomiaal contrast bevat de eerste vrijheidsgraad de lineaire
effect over de categorieën van de voorspellingsvariabele of -factor; de tweede bevat het kwadratische effect, enz. De categorieën worden verondersteld gelijkmatig te zijn verdeeld
Helmert contrasten
= Het effect van elke categorie van de voorspellingsvariabele of -factor, behalve de laatste, wordt vergeleken met het gemiddelde effect van de daaropvolgende categorieën.
Verschilcontrasten
Het effect van elke categorie van de voorspellingsvariabele of -factor, behalve de eerste, wordt vergeleken met het gemiddelde effect van de voorgaande categorieën. Ook wel bekend als de omgekeerde Helmert contrasten.
LSD
= het kleinste significante verschil tussen twee gemiddelden, alle grotere verschillen zijn significant
Probleem van kanskapitalisatie:
door herhaald toetsen, telkens met kans op een fout van type I (H0 onterecht verwerpen) wordt het totale risico op Type I fout zeer groot
alfa wordt bepaald voor elk paar verwachtingen en niet voor het geheel van de paren
Bonferroni-methode
strengere α=(α/aantal paren) -> garandeert dat de kans op minstens 1 foutieve verwerping van H0 onder ALLE gemaakte vergelijkingen, niet groter is dan bijv. .05!
-> betere bescherming tegen inflatie Type I fout, maar kan ook zorgen voor een inflatie van de Type II fout bij groot aantal vergelijkingen
Bootstrapping
= schatting van de steekproefverdeling van een schatter door middel van een steekproef met vervanging van de oorspronkelijke steekproef
Jackknifing
Dezelfde test wordt herhaald door telkens één proefpersoon weg te laten.
Permutatie
= gegevens worden willekeurig opnieuw toegewezen, zodat een exacte p-waarde wordt berekend op basis van de gepermuteerde gegevens
Niet-parametrische benaderingen
= Ontwikkeld voor het analyseren van gegevens met ongelijke groepsvarianties
Het meest gebruikt is de Kruskal-Wallis-test (ANOVA op rangen).