samenhang en statistische controle Flashcards

1
Q

3 doelstellingen bij onderzoek naar de samenhang tussen 2 (ordinale of nominale) variabelen dmv een kruistabel

A

1) richting en aard van het verband, door de kolom en rijpercentages te berekenen. die toelaten de relztieve conditionele verdeling van Y te vergelijken met X en omgekeerd
2) nagaan of de samenhang significant is (door chi-kwadraat toets)
3) de sterkte van de samenhang nagaan door associatiematen (phi-kwadraat, cramers V, odds-ratio’s)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

statistische onafhankelijkheid

A

wanneer de waarde voor variabele A niet helpt om de waarde van variabele B te bepalen, gegeven dat de marginale verdeling van b is gekend en omgekeerd. Bij statistische onafhankelijkheid geldt de productregel: P(a en b) = P(b) x P(a)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

ch-kwadraat waarde

A

wordt berekend door de gekwadrateerde afwijkingen tussen de verwachte en geobserveerde celfrequenties. We berekenen dit om de kans te bepalen dat we de geobserveerde samenhng aantreffen in een steekproef wanneer de nulhypothese correct is. (nulhypothese = er is geen statistische afhankelijkheid)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

vrijheidsgraden

A

het aantal elementen in de berekening van de steekproefgrootheid die vrij kunnen varieëren. bij de chi-kwadraat verdeling is dit (r-1)x(c-1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

chi-kwadraat verdeling

A

een verdeling die volledig boven nul ligt en bij een hoog aantal vrijheidsgraden de normale verdeling benadert met het aantal vrijheidsgraden als gemiddelde (laag aantal vrijheidsgraden = positief assymetrische vorm)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

associatiematen

A

kengetallen die op een gestandaardiseerde manier (genormeerd, met waarden tussen 0 en 1) de sterkte van de samenhang tussen twee variabelen weergeven

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

associatiematen voor nominaal (en ordinaal) meetniveau

A
  • phi-kwadraat: symmetrisch, 0 = statistische onafhankelijkheid, enkel in een (2xc) kruistabel mogelijk
  • cramers V: symmetrisch, 0 = statistische onafhankelijkheid, in een (rxc) kruistabel mogelijk
  • odds-ratio’s: verhouding van de odds, 1 = statistische onafhankelijkheid
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

replicatie

A

het verband blijft hetzelfde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

schijnverband

A

de samenhang verdwijnt of wordt zwakker en de derde variabele is een causale antecedent: de samenhang wordt gedeeltelijk (weg)verklaard (in een kruistabel: er is een verschil tussen de rijen, maar niet tussen de kolommen of omgekeerd)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

interpretatie

A

de samenhang verdwijnt of wordt zwakker en de derde variabele is een tussenliggende variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

suppressor

A

de samenhang verschijnt of wordt sterker

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

interactie

A

de samenhang verschilt naargelang de categorieën van de derde veranderlijke

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

scatterplot

A

schetst het verband tussen twee variabelen op ratio of interval meetniveau, gemeten bij dezelfde eenheden of observaties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

analytische afhankelijkheid

A

Waarde van ene variabele (kijkduur) kan exact bepaald worden aan de hand van de waarde van de andere variabele: er is een analytisch verband tussen beide veranderlijken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

stochastische afhankelijkheid

A

het is mogelijk een schatting van de ene variabele op basis van de andere te geven, maar het is niet mogelijk een exacte relatie tussen beide variabelen weer te geven

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

stochastische onafhankelijkheid

A

kennis van de waarde van de ene variabele helpt ons niet om een betere schatting te maken van de waarden van de andere variabele

17
Q

positieve samenhang afleiden uit een scatterplot

A
  • respondenten liggen voornamelijk in kwadrant 1 en 3 (hoge waarden voor variabele x gaan samen met hoge waarden voor variabele y en omgekeerd)
  • som (= covariatie) en gemiddelde (= covariantie) van de kruisproducten zijn beide positief
18
Q

negatieve samenhang afleiden uit een scatterplot

A
  • respondenten liggen voornamelijk in kwadrant 2 en 4 (lage waarden voor x en hoge waarden voor y gaan samen)
  • som (covariatie) en gemiddelde (covariantie) van de kruisproducten zijn beide negatief
19
Q

covariatie (myx)

A

som van de kruisproducten en een maat voor lineaire samenhang tussen twee variabelen van ratio- of intervalmeetniveau

  • > 0 bij statistische onafhankelijkheid (maar steeds kijken naar scatterplot, want kan misleidend zijn!)
  • > geen vaste boven of ondergrens + gevoelig aan meeteenheid
20
Q

covariantie (sxy)

A

som van de kruisproducten gedeeld door N is een symmetrische maat voor lineaire samenhang tussen twee variabelen van interval- of ratiomeetniveau

  • > 0 bij statistische onafhankelijkheid (maar steeds kijken naar scatterplot, want kan misleidend zijn!)
  • > geen vaste boven of ondergrens + gevoelig aan meeteenheid
21
Q

pearson product-moment correlatie-coëffciënt (rxy)

A

standaardiseert de covariantie (sxy) door deze te delen door het product van de standaardafwijkingen.

  • > symmetrisch
  • > ongevoelig voor meeteenheid
  • > begrensd tussen -1 en +1
  • > 0 = statistisch onafhankelijk
  • > gevoelig voor outliers!!
22
Q

fuck partiele correlatiecoefficient

A

ja