Testen Flashcards
²
tests met 2 steekproeven
- gepaarde steekproeven
- afhankelijke variabelen
- herhaalde metingen op zelfde persoon
- andere parameters op zelfde persoon
- relaties van personen vb: broers & zussen - ongepaarde steekproeven = onafh.
t-test voor 2 ongepaarde steekproeven
- voorwaarden
- continue variabele
- normaal verdeeld = parametrisch
–> Shapiro-Wilk test
- test van Levene = gelijke variates in populatie
- 2 ongepaarde steekproeven - test van Levene
- H0: σ² 1 = σ²2
–> populatie varianties zijn gelijk
- H1: ≠
–> SPSS toont deze door P-waarde te geven
- altijd op significantie 0,05 -> ookal is test op ander niveau - formule
- S = pooled standaard deviatie
- gemiddelde dat rekening houd met aantal
verdeling t-test voor 2 ongepaarde steekproeven
- definitie = X ≈ t n1+n2-2
- oplossing = de 3 methoden
- kritieke waarden
- p-waarde
- betrouwbaarheidsinterval van het verschil in populatie gemiddelde - hypothesen
- H0: μ1 = μ2
- H1: μ1 ≠ μ2
–> herfolumering door SPSS: H0: μ1-μ2 = 0
t-test runnen in SPSS
- analyze
- compare means & proportions
- independent-samples t-test
- variabele & groep aanduiden
- binnen groep specifiek subgroepen aanduiden
- mogelijkheid tot testen van 2 van de 4 groepen
- options = betrouwbaarheids niveau bepalen - variatie
- 2 rijen: equal variances assumed & - not assumed
- Levene test word gegeven = keuze H0 verwerpen of niet
- H0 niet verworpen = equal variances assumed
- H0 verworpen = not assumed = welsch modified test - uitkomst
- 95% confidence interval
- H0: μ1 - μ2 = 0
- ligt 0 in interval? - conclusie kunnen schrijven
- zowel inductief als descriptief
t-test manueel uitwerken via syntax
= altijd eerst tekenen zoals vorig jaar
- kritieke waarde = idf.t
- 2 argumenten van functie = linker opp, aantal vrijheidsgraden - oppervlakte = cdf.t
- 2 argumenten van functie = kritieke waarde, aantal vrijheidsgraden - p-waarde
- p = 2x p(T>t)
- p = 2x (1-cdf.t) - berkenen door compute
- vierkantswortel door sqrt functie
- absolute waarde door ABS functie
- formules omzetten in syntax =niet van buiten kennen
- altijd eerst tekeningen maken
- bij twijfel altijd haakjes zetten - formats = decimalen geven
- variabele ingeven die je wilt uitwerken
- op einde = (F8.3)
–> F = with & 3 = decimalen - execute = variabelen naar dataset brengen
- lists
- opnieuw variabelen ingeven
- limiteren van output bij niet elke case
- einde = /cases 1.
alternatieven van ongepaarde t-test
= voorwaarden niet voldaan
- Welch’s modified t-test
- niet gelijke varianties = Test van Levene niet voldaan
- ook voor meerdere steekproeven - Mann-Whitney U-test
- niet-parametrische variant van ongepaarde t-test
- kan ook bij ordinale variabele - one-way ANOVA
- meerdere steekproeven
- zelfde voorwaarden
Mann-Whitney U-test
- voorwaarden
- continue & ordinale variabele
- niet normaal verdeel = niet-parametrisch
- 2 ongepaarde steekproeven
- synoniem = wilcoxon rank-sum test - hypothesen
- H0: n1 = n2
–> beide groepen hebben zelfde distributie ≈ populatie
- H1: n1 ≠ n2 - formules
- W = rangsom
- N = n1+n2
- T^3-T = correctie factor voor ties = zelfde waarden in data set
Mann-Whitney U-test procedure rangwaardes
1 rangschik
- elke observatie observatie van klein naar groot
- ongeacht uit welke groep
4. ken een rangwaarde toe
- indien ties = gemiddelde rang toekennen
- t³-t berekenen per cluster
5. ken totale rangsom per groep toe
6. testsatisitiek berkenen
- n1 & n2 = aantal per groep
- W1 & W2 = rangsom per groep
- u1 & u2 -> U
- W1 + W2 moet gelijk zijn aan (N(N+1))/2
- u1 + u2 moet gelijk zijn aan n1 x n2
- z-waarde
7. interpreteren
- via 3 methoden met Z-waarde
- gebruik van mediaan & interkwartiel afstand
oplossen Mann-Whitney U-test
beide manieren kennen
als vraag stelling open is mag je kiezen
- methode 1 = legacy dialogs
- oude manier van testen opvragen vanuit vorige versies van SPSS - methode 2 = vernieuwde interface
- meer info
selecteren
1. analyze
2. non-parametric tests
3. vernieuwde interface
- 3 icoontjes
- one sample
- independent sample
- related sample
+ legacy dialogs
legacy dialogs Mann-Whitney U-test
- legacy dialogs
- 2 independent samples
- variabele selecteren
- onafhankelijke variabele selecteren
–> groepen aanduiden
- variabele eigenschappen bekijken met sneltoets boven - outcome
- W = sum of ranks
- mean rang: verschillend of niet?
- Mann-Whitney U = U-waarde
- Wilcoxon W = kleinste rangsom
- Z-waarde = teststatistiek
- asymptotische p-waarde
- exacte p-waarde
–> licht verschillend maar je mag beide gebruiken - p-waarde manueel berekenen
- 2 x (1-cdf.normal(Z, 0, 1))
vernieuwde interface
- independent samples
- 3 tabbladen
- objective = customize analysis ALTIJD
- fields = 1 variabele selecteren & groepen selecteren
- settings = customize test
–> enkel Mann-Whit U-test aanvinken
–> in toekomst nog andere ook - outcome
gepaarde t-test
- kiezen van test
- aantal groepen = 2
- gepaarde groepen
- meetniveau = continue variabele
- parametrische test = normaal verdeeld = eerst exploratieve data analyze uitvoeren
–> niet parametrisch = Wilcoxon matched-pairs signed-ranks test - hypothese
- H0: δ = 0
–> verschil van gemiddeldes
- H1:
–> eenzijdig: δ < 0 of δ > 0
–> tweedzijdig: δ ≠ 0 - formules
- D = gemiddeld verschil
- Sd = standaard deviatie van het verschil
–> normaliteit nagaan
- t verdeling: t n-1
gepaarde t-test op SPSS
- analyze
- compare means & proportions
- pared samples t-test
- variabelen selecteren - options
- standaard niveau aanpassen - eerste tabel = descriptieve statistiek maar niet gebruiken voor rapporteren
- tweede tabel = niet bespreken
- derde tabel
- mean = D & std. deviation = Sd
- t = teststatistiek
- one-sided p
- twe-sided p
–> afh van nood een kiezen
- kritieke waarde nooit in tabel = atlijd via syntax berekenen
Wilcoxon matched-pairs signed-ranks test
- gebruik
- niet parametrische variant van gepaarde t-test
- 2 gepaarde steekproeven
- continue variabele die niet normaal verdeeld is of ordinale variabele - hypothese
- H0: δ = 0
–> verschil van MEDIAAN ≠ t-test
- H1:
–> eenzijdig: δ < 0 of δ > 0
–> tweedzijdig: δ ≠ 0 - testgrootheid = T
- T = som van positieve rangsom
- n = aantal niet-0 verschillen
Wilcoxon matched-pairs signed-ranks test rangen
- bereken voor elk paar van observaties het verschil X2-X1
- ken een rang toe op absolute verschillen
- rang zonder teken = geen onderscheid tussen negatief en positief
- orderenen van kleinste verschillen
- voor niet-0 verschillen - bij ties
- 2 & -2 zouden ties zijn
- gemiddelde rang
- t^3-t met t = cluster van ties - ken negatieve rang toe indien negatief verschil betreft
- rang met teken
- rang combineren met teken van verschil
- positieve rangsom = som van positieve rangen
Wilcoxon matched-pairs signed-ranks test SPSS
legacy diaglogs
1. analyze
2. non-parametric test
3. legacy dialogs
4. 2 related samples
5. variabelen selecteren in zelfde rij
6. outcome
- enkel kijken naar positieve rangsom
- ties in SPSS ≠ ties hoe wij die benoemen = niet naar kijken
- teststatistiekk kan negatief zijn door andere uitwerking (gebruik van kleinste rangsom)
vernieuwde interface
1. analyze
2. non-parametric test
3. related samples
4. vensters
- objective = customize analysis
- fields = variabelen selecteren
- settings = customize test -> wilcoxon
5. outcome
- enkel naar tabellen kijken
- standaard error = sigmaT
- standardized = T’
Chi-kwadraad test
- gebruik
- dichtome (categorische) variabele
- 2 ongepaarde steekproeven
- voorstellen als 2x2 kruistabel - hypothese
- H0: π1 = π2
–> H0: er is geen associatie tussen de beide variabelen
- H1: π1 ≠ π2
–> H1: er is wel associatie
- π = percentage in tabel - voorwaarden
- niet meer dan 20% van de verwachte frequenties (E) mag kleiner zijn dan 5
- geen enkele categorie mag een verwachte frequentie kleiner dan 1 hebben
- indien voorwaarden niet vervuld = Fischer’s exact test
kruistabel van Chi-kwadraad test
- algemeen
- groep A & B
- eigenschap aanwezig & afwezig
- niet effectief een tabel in SPSS - frequenties
- frequenties in elke groep = O observed
–> testen tegenover verwachte frequenties = E (expected)
- E = rij x kolom / n (aantal) - testgrootheid
- dubbele sommatie = voor rij & kolom
- berekening voor elke cel - Chi-kwadraat verdeling
- gekenmerkt door df = degrees of freedom
- r x k dan is df = r-1 x k-1
- bij 2x2 tabel is df = 1
verkorte manier van kruistabel in SPSS
- drie variabelen aanmaken = ALTIJD!
- rijvariabele
- kolomvariabele
- aantal variabele - wegingsvariabele toekennen van aantal variabele
- basis actie
- data -> weight cases - aantal rijen = aantal cellen van r x k tabbel
Chi-kwadraat voorstellingen in SPSS
2x2 tabel tonen met nodige percentages
1. analyze
2. descriptive statistics
3. crosstabs
4. rij & kolom aanduiden = maakt niet uit
5. cells = aanvinken
- observed
- expected
- row percentages
grafische voorstelling = staafdiagram
1. graphs
2. chart builder = warning weg clikken
3. bar -> clustered bar
4. drag & drop
- clustered bar naar hoofdscherm
- variabelen naar jusite as of “cluster on x”
5. count vervangen door percentage
- set parameters
- total for each X-axis category
Chi-kwadraat test in SPSS
begin ≈kruistabel
1. analyze
2. descriptive statistics
3. crosstabs
4. rij & kolom aanduiden = maakt niet uit
5. cells = aanvinken
- observed
- expected
- row percentages
6. statistics = Chi-square selecteren
7. voorwaarden
- SPSS runt altijd ookal zijn voorwaarden niet voldaan
- in voetnoot worden ze vermeld
8. tabel
9. betrouwbaarheids interval volgens Newcombe berekenen
Crosstabs voor testen
- Chi-kwadraat 2X2
- observed
- expected
- row percentages - McNemar
- observed
- expected
- total percantages - Chi-kwadraat RXK
- observed
- expected
- row & column percentages
betrouwbaarheids interval volgens Newcombe berekenen
- analyze
- compare means & proportions
- independent-samples proportions
- test varbele kiezen = variabele dat effect zou ervaren van verschil
- succes waarde kiezen = welke waarde toegescheven aan eigenschap wordt getest
- grouping variabele kiezen
–> waarden aanpassen
- confidence interval -> newcombe kiezen
- tests = alles uitschakelen - outcome
- difference in proporitons = percentage van verschil
- betrouwbaarheid interval ook in percentages gegeven
zelfde test McNemar maar voor paired-samples proportions
McNemar test
- gebruik
- dichotome variabele
- 2 gepaarde steekproeven - hypothesen
- H0: verhoudingen van de karakteristiek in de populatie zijn voor beide situaties gelijk
- H1: verhoudingen zijn verschillend - tabel
- 2x2 zoals chi-kwadraat
- niet naar cellen kijken
- a + b vergelijken met a + c
- teststatistiek ook in chi-kwadraat verdeling
grafische voorstellingen van McNemar in SPSS
= ook eerst variabele wegen
2x2 tabel tonen met nodige percentages
1. analyze
2. descriptive statistics
3. crosstabs
4. rij & kolom aanduiden = maakt niet uit
5. cells = aanvinken
- observed
- expected
- TOTAL percentages
+ voor test
- statistics
- McNemar aanduiden
3D staafdiagram
1. graphs
2. chart builder
3. simple 3D bar
4. X & Z as = variabele
5. Y as = percentages
–> set parameters = grand total
test uitvoeren McNemar
2x2 tabel
–> p-waarde
legacy dialogs
1. analyze
2. non-parametric
3. legacy dialogs
4. 2-related samples
5. varabelen kiezen in zelfde rij
6. McNemar aanduiden
–> p-waarde & teststatistiek
vernieuwde interface
1. analyze
2. non-parametric
3. related samples
4. 3 tabbladen
- objectives = customize analysis
- fields = variabelen aanduiden
- settings = customize test -> McNemar kiezen
–> define succes = manueel ingeven
Kruskal-Wallis test
- voorwaarden
- uitbreiding Mann-Whitney U-test
- meerdere steekproeven
- niet parametrisch = niet normaal verdeeld
- continu variabele of ordinale
- ongepaarde steekproeven - hypothese
- H0: de groepen hebben dezelfde distributies
- H1: minstens 1 groep heeft een verschillende distributie - testgrootheid = H
- N = totale steekproef grootte
- k = aantal groepen
- Ri = rangsom van groep
- ni = aantal van groep
- gekenmerkt door chi-kwadraat verdeling = k-1
type 1 fout bij meerdere tests
- algemeen
- type 1 fout = ten onrechte verwerpen van nulhypothese
- alfa bepalen = significantie niveau
- wilt ook zeggen: kans op maken van type 1 fout - meerdere groepen
- k = n (n-1) / 2 paargewijze tests mogelijk
- kans op onterecht verwerpen = 1 - (1-alfa)^k
- bottum-up approach = meerdere keren Mann-Whitney U-test -> te grote fout
- top-down approach = 1 algemene overkoepelende test voor verschil aan te tonen
- indien verschil er is = zoeken naar onderlinge verschillen
bonferroni correctie
- post-hoc testen = enkel gebruiken indien verschil is aangetoont
- inhoud
- significantie niveau aanpassen
- volgens aantal simultane test
- verlagen tot alfa/k - nieuwe regels
- H0 verwerpen indien p < alfa/k
- in SPSS als p x k < alfa
–> cave: p kan > 1 worden
Kruskal-Wallis test procedure
= Mann-Whitney U-test voor meerdere groepen
- rangschik elke observatie van klein naar groot = van alle groepen door elkaar
- ken rangwaarde toe, bij ties gemiddelde nemen
- indien ties t^3-t per cluster van ties
- bereken rangsom per groep Ri
–> som van Ri moet = N(N+1)/2
Kruskal-Wallis test data
- exploratieve data = normaliteit bepalen
- Q-Q plot
- staafdiagram
- boxplot - decriptieve data = mediaan & interkwartiel afstand per groep
- split file aanzetten
- frequencies
- split file uitzetten - grafische voorstelling = boxplot
Kruskal-Wallis test SPSS met legacy dialogs
- analyze
- non-parametric
- K independent samples
- test & groep variabele selecteren
- range definiëren: min 1 & max (aantal groepen) - outcome
- mean rank = indien geen verschillen zijn deze gelijk aan elkaar
- H’, df & p gegeven onder test statistics - post-hoc testen uitvoeren indien H0 verworpen wordt
- Mann-Whitney U-test tussen elke groepen
- Bonferroni correctie. = p x aantal groepen
Kruskal-Wallis test SPSS met vernieuwde interface
= gemakkelijker want geen apparte testen nodig
- analyze
- non-parametric
- independent samples
- 3 tabbladen
- objective = customize analysis
- fields = test & groep variabele selecteren
- settings = test aanduiden
–> multiple comparisons: all pairwise
- test options = alfa-niveau aanpassen - pairwise comparisons in tabel
- enkel naar adjusted significance kijken = bonferroni correctie alreeds toegpast
- Dunn’s testen
one-way anova
- voorwaarden = analoog aan student’s t-test
- continue variabele
- ongepaarde variabelen
- normale verdeling in elke groep!
- gelijke varianties = nagaan door test van Levene - alternatieven
- niet parametrisch = Kruskal-Wallis test
- ongelijke variaties = Brow-Forsythe test of test van Welch - hypothesen
- H0: μ1 = μ2 = … = μk
- H1: voor minstens 1 koppel is μ1 ≠ μ2
- eerst overkoepelende test doen & dan pas onderliggende signifante verschillen zoeken = type 1 fout vermijden - one-way
- eenwegsvariantie analyse = 1 factor
- principe van opsplitsen van kwadratensommen
ANOVA tabel
= niet kennen maar kunnen interpreteren
- variantie = kwadratensom/df
- opsplitsen
- between-groups
- withing-groups
- beide optellen = totale som - wiskunde met cellen
- per rij = Sum of squares / Degrees of freedom = Mean square
- MS van betweengroups/whitin groups = F
- per kolom = between groups + within groups = total - vrijheidsgraden
- between groups = k-1
- within groups = n-k
- total = n-1
ANOVA procedure
- exploratieve statistiek
- grafische voorstellingen: Q-Q plot, boxplot & histogram
- normaliteitstesten = shapiro-wilk - combinatie van testen in one-way anova
- descriptieve statistiek per groep
- one-way ANOVA
- test van Levene = homogeneity of variance
–> bepalen of ANOVA (niet-sig) gebruiken of Welch/Brown-Forsythe (sig)
- test van Welch
- test van Brown-Forsythe
+ indien sign. Tukey post-hoc - uitvoeren
- analyze
- compare means & proporties
- one-way ANOVA
- dependent list = variabele -> factor = categorie
- in opties testen van hierboven kiezen
Friedman test
- voorwaarden
- niet normaal verdeeld = niet-parametrisch
- continue of ordinale variabele
- gepaarde steekproeven
- uitbreiding Wilcoxon
- parametrisch niet kennen - hypothese
- H0: groepen hebben zelfde distributie
- H1: minstens 1 groep heeft verschillende distributie - testgrootheid
- N = aantal personen per groep
- k = aantal groepen
- Ri = rangsom per groep
Friedman test procedure
- rangschik observaties per groep (rij) van klein naar groot
- ken rangwaarde toe per rij
- bij ties = gemiddelde & t^3-t per rij
- bereken rangsom per groep (kolom) Ri
- bereken teststatistiek
Friedman test uitvoeren
legacy dialogs
1. analyze
2. nonparametric
3. legacy dialogs
4. K related samples
- alle variabelen selecteren
- Friedman selecteren
vernieuwde interface
1. analyze
2. nonparametric
3. related samples
4. 3 tabbladen
- objective = customize analysis
- fields = alle variabelen selecteren
- settings = Friedman selecteren & all pairwise
Chi-kwadraat test voor meerdere steekproven
- gebruik
- meerdere steekproeven = RxK tabel = groter dan 2x2
- categorische variabele - hypothesen
- H0: geen associatie tussen de 2 kwalitatieve variabelen
–> distributie is zelfde in beide populaties
- H1: er is wel associatie tussen de 2 kwalitatieve variabelen - testgrootheid
- df = (r-1) x (kx1)
chi-kwadraat procedure
- descriptieve statistiek = vervangen door op einde tabel aanvragen & meteen test uit te voeren
- wegingsvariabele toekennen
- kruistabel met percentages
- analyze
- descriptive statistics
- crosstabs
- cells = aanduiden van gewilde info
–> observed, expected + row & column percentages
- meteen ook chi-kwadraat & fischer uitvoeren - kruistabel
- p-waarde = exact sig. = rechter oppervlakte
- als geen associatie tussen variabelen = verwachten dat categroiën gelijke verdelingen hebben - indien significant = post-hoc mogelijk = niet kennen
voorwaarden chi-kwadraat
- voorwaarden
- niet meer dan 20% van de verwachte frequenties mag kleiner zijn als 5
- geen enkele categorie mag een verwachte frequentie kleiner dan 1 hebben - indien voorwaarden niet voldaan
- Fischer’s exact test
- categoriën samennemen - categoriën samenvoegen = basis actie
- transform
- recode into different variables
- variabele selecteren & nieuwe naam toevoegen -> change
- old & new values = aanpassen voor ELKE categorie - exact
- zelfde crosstabs als chi-kwadraat
- exact -> exact -> time limit van 1min