samenhang en statistische controle Flashcards
3 doelstellingen bij onderzoek naar de samenhang tussen 2 (ordinale of nominale) variabelen dmv een kruistabel
1) richting en aard van het verband, door de kolom en rijpercentages te berekenen. die toelaten de relztieve conditionele verdeling van Y te vergelijken met X en omgekeerd
2) nagaan of de samenhang significant is (door chi-kwadraat toets)
3) de sterkte van de samenhang nagaan door associatiematen (phi-kwadraat, cramers V, odds-ratio’s)
statistische onafhankelijkheid
wanneer de waarde voor variabele A niet helpt om de waarde van variabele B te bepalen, gegeven dat de marginale verdeling van b is gekend en omgekeerd. Bij statistische onafhankelijkheid geldt de productregel: P(a en b) = P(b) x P(a)
ch-kwadraat waarde
wordt berekend door de gekwadrateerde afwijkingen tussen de verwachte en geobserveerde celfrequenties. We berekenen dit om de kans te bepalen dat we de geobserveerde samenhng aantreffen in een steekproef wanneer de nulhypothese correct is. (nulhypothese = er is geen statistische afhankelijkheid)
vrijheidsgraden
het aantal elementen in de berekening van de steekproefgrootheid die vrij kunnen varieëren. bij de chi-kwadraat verdeling is dit (r-1)x(c-1)
chi-kwadraat verdeling
een verdeling die volledig boven nul ligt en bij een hoog aantal vrijheidsgraden de normale verdeling benadert met het aantal vrijheidsgraden als gemiddelde (laag aantal vrijheidsgraden = positief assymetrische vorm)
associatiematen
kengetallen die op een gestandaardiseerde manier (genormeerd, met waarden tussen 0 en 1) de sterkte van de samenhang tussen twee variabelen weergeven
associatiematen voor nominaal (en ordinaal) meetniveau
- phi-kwadraat: symmetrisch, 0 = statistische onafhankelijkheid, enkel in een (2xc) kruistabel mogelijk
- cramers V: symmetrisch, 0 = statistische onafhankelijkheid, in een (rxc) kruistabel mogelijk
- odds-ratio’s: verhouding van de odds, 1 = statistische onafhankelijkheid
replicatie
het verband blijft hetzelfde
schijnverband
de samenhang verdwijnt of wordt zwakker en de derde variabele is een causale antecedent: de samenhang wordt gedeeltelijk (weg)verklaard (in een kruistabel: er is een verschil tussen de rijen, maar niet tussen de kolommen of omgekeerd)
interpretatie
de samenhang verdwijnt of wordt zwakker en de derde variabele is een tussenliggende variabele
suppressor
de samenhang verschijnt of wordt sterker
interactie
de samenhang verschilt naargelang de categorieën van de derde veranderlijke
scatterplot
schetst het verband tussen twee variabelen op ratio of interval meetniveau, gemeten bij dezelfde eenheden of observaties.
analytische afhankelijkheid
Waarde van ene variabele (kijkduur) kan exact bepaald worden aan de hand van de waarde van de andere variabele: er is een analytisch verband tussen beide veranderlijken
stochastische afhankelijkheid
het is mogelijk een schatting van de ene variabele op basis van de andere te geven, maar het is niet mogelijk een exacte relatie tussen beide variabelen weer te geven