2: Twee onafhankelijke variabelen Flashcards
Bivariate analyse
Analyse die naar elk type relatie tussen twee variabelen kijkt
Univariate
Analyse die naar één variabele kijkt
Pooled estimate (p ̂)
Bundelt het totale aantal successen en het totale aantal waarnemingen van de twee steekproeven
Stappen:
Hypothesetoetsing bij 2 onafhankelijke categorische variabelen- z-toets voor 2 proporties
1) Assumpties checken
- Categorische variabelen
- Onafhankelijke steekproeven (random toegewezen)
- Voldoende observaties
§ Eenzijdig: Minimaal 10 negatieve & 10 positieve
§ Tweezijdig: Minimaal 5 negatieve & 5 positieve
§ Anders Fisher’s exact test
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:P1-P2= 0
□ Geen effect
Alternatieve hypothese (HA of H1)
□ Eenzijdig: H_A:p_1−p_2>0 of H_A:p_1−p_2<0
□ Tweezijdig: H_A:p_1−p_2≠0
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Hoe groter z-score, hoe verder er vanaf dat H0 waar is
* Als H0 waar is, dan is z-score 0
4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij z-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
- p≤α→Verwerp H_0
- p>α→Niet H_0 verwerpen
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
Stappen:
Hypothesetoetsing 2 onafhankelijke kwantitatieve variabelen- t-toets voor 2 gemiddelden (met en zonder gepoolde sd)
1) Assumpties checken
- Kwantitatieve variabelen
- Onafhankelijke steekproeven
- Normaal verdeeld
§ Behalve bij grote steekproeven (N≥30
§ Behalve bij tweezijdig toetsen
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:μ_1−μ_2=0
□ Geen verschil
Alternatieve hypothese (HA of H1)
□ Eenzijdig: H_A:μ_1−μ_2>0 of H_A:μ_1−μ_2<0
□ Tweezijdig: H_A:μ_1−μ_2≠0
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Hoe groter t-score, hoe verder er vanaf dat H0 waar is
* 2 formules staandaardfout (afhankelijk van SD)
a) Zonder aannames
b) Met aanname σ1=σ2 (meer power)
(pooled standaarddeviatie)
4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij t-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)
* Afhankelijk van vrijheidsgraden
a) Zonder aannames
b) Met aannames
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
2 proporties, categorische variabelen (onafhankelijk) (3)
1) Hypothese/significantie test
2) Betrouwbaarheidsinterval
* Geeft weer tussen welke waarde het populatiegemiddelde waarschijnlijk ligt
* Assumpties:
- Binaire afhankelijke en onafhankelijke variabele
- Onafhankelijke steekproeven (random toegewezen)
- Voldoende observaties
§ Eenzijdig: Minimaal 10 negatieve & 10 positieve
§ Tweezijdig: Minimaal 5 negatieve & 5 positieve
* Betrouwbaarheidsinterval= (p ̂_1−p ̂2)±z(〖SE〗(p ̂_1−p ̂_2 ))
* Als de nul in betrouwbaarheidsinterval valt dan is het een plausibele waarde en geen significant verschil
* Gemiddelde: Gemiddelde verschil tussen de gemiddelden
3) Relatieve risico (ratio)
* Kijken naar verschil in proportie
* Bij hele kleine proporties
* Rekenen in ratio (verhouding) in plaats van verschil
* ratio=p_1/p_2
* Proportie van 0.06 en 0.04. 0.06/0.04=1.5
2 kwantitatieve variabelen (onafhankelijk) (2)
1) Hypothese/significantie test
* Aannames gelijke popultatievariantie
- Plausibel bij willekeurige trekking uit dezelfde populatie
- Mogelijke problemen bij
§ Bestaande groepen (jong/oud, man/vrouw)
§ Kleine groepen
§ Sterk verschillende groepsgroottes
- Onhoudbaar als SD meer dan een factor 2 van elkaar verschillen
§ Deel grootste SD door kleinste SD
§ Check of uitkomst kleiner dan 2
§ Zo ja, gelijke varianties aannemen
§ Zo nee, geen gelijke varianties aannemen
2) Betrouwbaarheidsinterval
* Assumpties
- Kwantitatieve afhankelijke variabele
- Binaire onafhankelijke variabele
- Onafhankelijke steekproeven
- Normaalverdeeld
§ Behalve bij grote steekproeven (N≥30
§ Behalve bij tweezijdig toetsen
- Gelijke variantie
* 95% interval= (x ̅_1−x ̅2)±1.96〖SE〗(x ̅_1−x ̅_2 )
- Komt overeen met tweezijdig toetsen
- Als de nul in betrouwbaarheidsinterval valt dan is het een plausibele waarde en geen significant verschil