Chi^2 (icke parametriska test) Flashcards
När används icke-parametriska metoder? 3x
- snedfördelade variabler. När du har nominaldata (frekvensdata) eller ordinaldata
- När din data inte kan anses vara normalfördelade
- När du inte är intresserad av någon parameter som u, q, p
inte lika stora krav som vid parametrisk hypotesprövning därför också mindre kraftfulla. Lägre power och högre risk för typ-2 fel om antaganden bakom parametrisk testning är uppfyllda.
Hur går en hypotesprövning till i Chi-två?
vid frekvensdata, vanligen nominaldata
vid ordinaldata
Nominaldata (man/kvinna 1/0) - Man jämför den fördelningsform man har erhållit med den fördelningsform som slumpen skulle ge. Är fördelningsformen tillräckligt osannolik att få av en slump förkastas nollhypotesen.
även för ordinaldata kan man räkna frekvenser för varje varibaelvärde. Kvotdata (ålder ex) kan omvandlas till ordinaldata (unga, medelålders, gamla)
Chi square for goodness of fit
enklaste situationen för x^2, den då vi vill kunna avgöra om fördelningen av ett antal observationer på en variabels olika variabelvärden kan ha uppstått av en slump.
formel: X2= Z (o-e)2/e
o: oberserved frekvens
df: k - 1
p: 1/k
e: expected frekvens
Ex: patienter talar om vilken terapiform de gillar bäst (A eller B). Kan endast välja ett alternativ. Obervationerna är oberoende av varandra. Brukar redovisas i en frekvenstabell.
Hur många fler måste välja den enda metoden för att skillnaden ska vara signifikant, dvs för att vi ska tro att det vi observerat i vårt stickprov ska vara representativt för alla i Örebro? Kan ej använda medelvärde, annan parameter, t eller f-test.
H0: frekvensfördelningen kan ha uppkommit av slump. Ingen skillnad mellan hur många som valt metod A och B
H1 : frekvensfördelningen kan inte ha uppkommit av en slump. Det finns en skillnad mellan antalen som valt metod A och B
Om vi förutom variebeln Behandlingsmetod (A och B) dessutom blandar in åldersvariabel används?
Chi square test for independence
korstabell / contingency table
observerade värden - samma formel som för Chi-två
df: (r-1)(k-1)
r - antalet klasser för variabel 1 (antalet radern)
k - antalet klasser för variabel 2 (antalet kolumner)
förväntade värden formel: erk = Or x Ok /n
Chi-två Goodness of fit - signifikansprövning
Hur avvikande måste ett estimat vara för att vi ska kunna förkasta Ho?
alfa 0.05
Om vi har fått ett signifikant resultat är nästa steg Chi-två Post-hoc test (risk för typ-1 fel ökar)
Konfidensintervall för Chi-två Goodness of fit
Vad gick vi igenom på lektionen idag?
- Chi square for goodness of fit
- Chi-två test for independence
- Chi-två signifikansprövning (post-hoc)
- Konfidensintervall för Chi-två