CHI^2-test Flashcards
Hvad har I brugt Chi^2 til?
Vi har bl.a. brugt CHI^2 til at vurdere om der var en sammenhæng mellem baggrundsvariablerne: indkomst, køn og hvorvidt man køber nyt eller brugt.
Hvad er en Chi^2 test? / hvad tester man og hvordan fungerer det?
Man tester om der er sammenhæng mellem to variable, som typisk ikke har numeriske skala, dvs. nominal skala og ordinal skala.
Det fungerer ved at man opstiller 2 hypoteser:
H0: Der er ingen sammenhæng mellem x og x (uafhængighed)
HA: Der er en sammenhæng mellem x og x. (afhængighed)
Man tester typisk på et 5% signifikansniveau og bruger p-værdien til at afgøre om man skal forkaste h0 eller ej.
Dog skal forudsætning om alle EIJ er større end 5 være opfyldt.
Hvis signifikansnivuaet er større end p-værdien, så skal man forkaste h0. Dvs. man nu har fundet en sammenhæng og den skal man herefter finde.
Hvilke krav til skalatype er der til Chi^2
Skalakrav: Ikke numeriske data. Dvs. man bruger enten nominal eller ordinal skala.
MEN* Det er som sådan ikke et krav krav, det er blot for overskuelighedens skyld.
Hvad er Cramers V?
Skulle testen vise en sammenhæng, bør man lige kigge på Cramers V, inden man drager en konklusion. Cramers V er indikerer hvorvidt styrken af sammenhæng har en lille eller stor effekt.
Note:
Det er en test man udfører efter CHI2 testen. CHI2 testen vurderer om der er en statistisk signifkant sammenhæng mellem to variable, men problem med testen er at den bliver signifikant automatisk jo flere observationer man tager ind. Har man over 10.000 observationer, alle chi2 tests bliver signfikante. For at løse problemet med store stikprøver udfører man en Cramers V test for at se om sammenhæng har en betydning i praksis.
Hvad er en krydstabel?
Det er en tabel opbygget af celler, som viser antal observationer for hver af kategorierne i de to variable.
Hvilke forudsætninger er der til CHI^2?
Uafhængighed - dvs. oberservationerne skal være uafhængige. Svarene må ikke være afhængige af hinanden.
Forventede værdi: Alle forventede værdier skal være over 5.
Missing values: Skal fjernes.
Hvad kunne et problem med CHI^2 være?
Det er en deskriptiv analyse, og der er ingen korrelation variablerne.
○ EX: X og Y, hvor X (geografi) og Y(jobtilfredshed)
Hvis man undersøger sammenhængen mellem disse to variable, så vil problemet være at en tredje variabel (fx Z = alder), kan have indflydelse på jobtilfredsheden.
En analyse som kan tage højde for flere variable er multipel-regression