Learning statistics with jamovi: a tutorial for psychology students and other beginners (10 Kategorisk dataanalyse) Flashcards

1
Q

Hva er Kategorisk dataanalyse?

A

Kategorisk dataanalyse refererer til en samling verktøy som du kan bruke når dataene dine er i nominell skala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva kan en X^2 (godhet-of-fit test) vise til? Vis til formel

A

En godhet-of-fit-test kan brukes til å avgjøre om tallene i hver kategori av f.eks en helse undersøkelse – forbedret, ingen endring eller forverret – samsvarer med tallene som kan forventes gitt standard behandlingsalternativ.

EKS:
(Observert frekvens-forventet frekvens)^2/forventet frekvens

Eksempel Tabell 10.5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Noen notasjoner som er grei å kunne: Hva står disse for? E/Ei, O/Oi og P/Pi?

A

E/Ei=forventet frekvens
O/Oi=observert frekvens
P/Pi=Sannsynlighet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvordan henger frihetsgrader sammen med godhet-of-fit testen?

A

Når man har brukt formelen og funnet et tall fra X^2 testen, må den kjøres opp mot antall frihetsgrader og alfra nivået for å se om nullhypotesen kan forkastes.

EKS:
Du får tallet fra forrige kort 8,44 og finner ut at det er 3 frihetsgrader med et alfra nivå på 0.05. Da ser du bak i boken og finner 7,815 (ergo du må forkaste nullhypotesen. Det er altså en ensidig test og den er over det nivået som den skal for at vi skal kunne beholde H0

Eksempel Tabell 5 og Tabell 6

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvordan bør en test bli presentert når den er fullført? 4 punkter

A
  1. Den statistiske testen innledes med den beskrivende statistikken .
    Det vil si at jeg fortalte leseren noe om hvordan dataene ser ut før jeg gikk videre til testen. Generelt er dette god praksis. Husk alltid at leseren din ikke kjenner dataene dine i nærheten av så godt som deg.
  2. Beskrivelsen forteller deg hva nullhypotesen som testes er.
    For å være ærlig, forfattere gjør ikke alltid dette, men det er ofte en god idé i de situasjonene der det er noen tvetydigheter, eller når du ikke kan stole på at leseren din er godt kjent med de statistiske verktøyene du bruker. Ganske ofte kan det hende at leseren ikke kjenner (eller husker) alle detaljene i testen du bruker, så det er en slags høflighet å “minne” dem!
  3. En “statblokk” er inkludert .
    Da jeg rapporterte resultatene av selve testen, sa jeg ikke bare at resultatet var signifikant, jeg inkluderte en “statblokk” (dvs. den tette matematisk utseende delen i parentes) som rapporterer all “nøkkel” statistisk informasjon. eksempel 10.1.9
  4. Resultatene tolkes .
    I tillegg til å indikere at resultatet var signifikant, ga jeg en tolkning av resultatet (dvs. at folk ikke valgte tilfeldig). Dette er også en vennlighet til leseren, fordi det forteller dem noe om hva de bør tro om hva som foregår i dataene dine. Hvis du ikke inkluderer noe slikt, er det veldig vanskelig for leseren å forstå hva som skjer.

Overall:
Som med alt annet, bør din overordnede bekymring være at du forklarer ting til leseren din. Husk alltid at poenget med å rapportere resultatene dine er å kommunisere til et annet menneske.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er formelen for frihetsgrader?

A

df=(r-1)(c-1)

Der r er rader og c er kolonner som inneholder totale observerte frekvenser.

annen forklaring:

df= (nummer av obervasjoner)-(nummer av begrensninger) men dette blir med litt regning det samme som det over.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva menes med Yates-korreksjon (handler om frihetsgrader)

A

Det er en liten endring du må gjøre i beregningene dine når du bare har én frihetsgrad. Det kalles “kontinuitetskorreksjon”, eller noen ganger Yates-korreksjonen .

Forklaring:
Nærmere bestemt når N er liten og når df=1, har godhetsstatistikken en tendens til å være “for stor”, noe som betyr at du faktisk har en større Alfa verdi enn du tror (eller tilsvarende p-verdiene er litt for små).

Du kan spesifisere denne korreksjonen i jamovi fra en avmerkingsboks i ‘Statistics’-alternativene, der den heter ‘X^2
kontinuitetskorreksjon’.

Sto veldig kort!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er forutsetningene for kjikvadrattestene som er diskutert så langt i dette kapittelet?

A
  1. Forventede frekvenser er tilstrekkelig store. Meningene er forskjellige, men standardantakelsen ser ut til å være at du generelt ønsker å se alle dine forventede frekvenser større enn omtrent 5, men for større tabeller vil du sannsynligvis være i orden hvis minst 80 % av de forventede frekvensene er over 5 og ingen av dem er under 1

2.
Data er uavhengige av hverandre . En litt skjult antakelse av kjikvadrattesten er at du virkelig må tro at observasjonene er uavhengige. Her er hva jeg mener. Anta at jeg er interessert i andelen av babyer født på et bestemt sykehus som er gutter. Jeg går rundt på fødeavdelingene og observerer 20 jenter og bare 10 gutter. Virker som en ganske overbevisende forskjell, ikke sant? Men senere viser det seg at jeg faktisk hadde gått inn på samme avdeling 10 ganger, og faktisk hadde jeg bare sett 2 jenter og 1 gutt. Ikke like overbevisende, er det? Mine opprinnelige 30 observasjoner var massivt ikke-uavhengige, og tilsvarte faktisk bare 3 uavhengige observasjoner. Dette er åpenbart et ekstremt (og ekstremt dumt) eksempel, men det illustrerer det grunnleggende problemet. Ikke-uavhengighet “stopper opp ting”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Forklar kort Fishers eksakte test og når den brukes

A

Den brukes når celletallene dine er for små, og du ikke har mulighet å samle inn mer data.

Fishers eksakte test fungerer noe annerledes enn kjikvadrattesten (eller faktisk noen av de andre hypotesetestene som jeg snakker om i denne boken) i den grad den ikke har en teststatistikk, men den beregner p-verdi “direkte”.

Syns det sto utrolig vanskelig, men var også et veldig liten del

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er McNemar-testen?

A

I en test med 100 respondenter (N=100) skal de se hvor mange som endrer mening etter en annonse. Men dersom de fører ned 100 før og 100 etter og alle svarene, så får de i totalt 200 observasjoner eller svar. Så det Mcnemar-testen var brukt til var å lage en tabell som gjorde det mulig å forholde seg til 100 respondenter med 100 svar.

Eksempel Tabell 10.13

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

hvordan blir resultatene i en test påvirket, dersom man hadde brukt X^2 istedenfor McNemar som teori?

A

Du kan ha helt samme test, med de samme svarene og observasjonene, men resultatet vil være anderledes.

Eksempel Figur 10.8

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Sammendrag av X^2:

A

1.
De X^2 (chi-kvadrat) goodness-of-fit-test brukes når du har en tabell over observerte frekvenser for forskjellige kategorier, og nullhypotesen gir deg et sett med “kjente” sannsynligheter å sammenligne dem med.

FEKS:
Hva velger folk i en kortstokk av de ulike symbolene
Her er det sannsynligheten at 4 ting/valg er like sannsynlig du måler.

2.
De X^2 test av uavhengighet (eller assosiasjon) brukes når du har en beredskapstabell (krysstabell) av to kategoriske variabler. Nullhypotesen er at det ikke er noen sammenheng eller assosiasjon mellom variablene.

FEKS:
Her måler du at to eller flere ting er like sannsynlig opp mot hverandre. Like sannsynlig at kvinner og menn velger en av de fire alternativene f.eks

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva menes med marginal homogenitet?

A

Det vil si at radsummene og kolonnesummene har samme fordeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly