Learning statistics with jamovi: a tutorial for psychology students and other beginners (14 Faktoriell ANOVA) Flashcards
Hva er en toveis ANOVA også kjent som faktoriell ANOVA?
vi har to grupperingsvariabler, refererer vi noen ganger til analysen som en toveis ANOVA, i motsetning til enveis ANOVAene som vi kjørte i kapittel 13.
EKS:
Anta for eksempel at vi var interessert i å bruke leseforståelsestesten til å måle elevers prestasjoner på tre forskjellige skoler, og vi mistenker at jenter og gutter utvikler seg i ulik hastighet (og derfor forventes å ha ulik ytelse i gjennomsnitt). Hver elev klassifiseres på to forskjellige måter: ut fra kjønn og skole. Det vi ønsker å gjøre er å analysere leseforståelsesskårene når det gjelder begge disse grupperingsvariablene.
Hvis det er to effekter som er positive når man tester, hvordan skrives det?
for å bruke den mer teknisk korrekte terminologien, vil vi si at det er “to hovedeffekter” av f.eks medikament og terapi. Så må man rampse opp den rette måten å skrive det på som er vist mange ganger tidligere (med p-verdi, F-verdi og signifikant eller betydelig effekt), men da må begge skrives slik.
Hvorfor kan man få forskjellig p-verdi for en enveis og en toveis ANOVA?
EKS:
Svaret ligger i å forstå hvordan residualene beregnes. Husk at hele ideen bak en F-test er å sammenligne variabiliteten som kan tilskrives en bestemt faktor med variabiliteten som ikke kan gjøres rede for (residualene). Hvis du kjører en enveis ANOVA for terapi, og derfor ignorerer effekten av medikament, vil ANOVA ende opp med å dumpe all den medikamentinduserte variasjonen inn i restene! Dette har den effekten at dataene ser mer støyende ut enn de egentlig er, og effekten av terapi som korrekt er funnet å være signifikant i toveis ANOVA blir nå ikke-signifikant. Hvis vi ignorerer noe som faktisk betyr noe (f.eks. narkotika) når vi prøver å vurdere bidraget til noe annet (f.eks. terapi), vil analysen vår bli forvrengt. Selvfølgelig er det helt greit å ignorere variabler som er genuint irrelevante for fenomenet interesse. Hvis vi hadde registrert fargen på veggene, og det viste seg å være en ikke-vesentlig faktor i en treveis ANOVA, ville det vært helt greit å se bort fra det og bare rapportere den enklere toveis ANOVA som ikke inkluderer denne irrelevante faktoren.
Hva er viktig å være klar over når man skal tolke hovedeffekter for tester med interaksjoner?
Dette skjer noen ganger. For eksempel, i crossover-interaksjonen vist i figur 14.5 (a), er dette nøyaktig hva du vil finne. I dette tilfellet vil ingen av hovedeffektene være signifikante, men interaksjonseffekten vil være det. Dette er en vanskelig situasjon å tolke, og folk blir ofte litt forvirret over det. Det generelle rådet som statistikere liker å gi i denne situasjonen, er at du ikke bør være særlig oppmerksom på hovedeffektene når en interaksjon er tilstede. Grunnen til at de sier dette er at selv om testene av hovedeffektene er helt gyldige fra et matematisk synspunkt, tester hovedeffektene sjelden interessante hypoteser når det er en signifikant interaksjonseffekt.
EKS:
Her er hva jeg mener. Igjen, la oss holde oss til et klinisk eksempel. Anta at vi hadde en
design som sammenligner to forskjellige behandlinger for fobier (f.eks. systematisk desensibilisering vs flom), og to forskjellige angstreduserende medisiner (f.eks. Anxifree vs Joyzepam). Anta nå at det vi fant var at Anxifree ikke hadde noen effekt når desensibilisering var behandlingen, og Joyzepam hadde ingen effekt når flom var behandlingen. Men begge var ganske effektive for den andre behandlingen. Dette er en klassisk crossover-interaksjon, og det vi vil finne når vi kjører ANOVA er at det ikke er noen hovedeffekt av stoffet, men en betydelig interaksjon.
Eksempel Figur 14.5 a
Hva er forbindelsen mellom n^2 og delvis n^2 (n^2p)?
n^2 står for den variansen som er redegjort for, så resterende verdi mellom 0 og 1 er ikke redegjort for (residualene)
EKS:
Ser på n^2 verdier først ser vi at stoffet står for 71 % av variansen (dvs n^2=0.71) i humør.gain, mens terapi bare utgjør 10 %. Dette gjør at totalt 19 % av variasjonen ikke er redegjort for (dvs. residualene utgjør 19 % av variasjonen i utfallet). Samlet sett innebærer dette at vi har en veldig stor effekt 8 av medikament og en beskjeden effekt av terapi.
Delvis n^2:
Da tar man vekk variansen av en av de f.eks to eller tre tingene man tester. Slik at man bare har variansen for en av de.
EKS:
Fordi effekten av terapi ikke er så stor, gjør det ikke så mye å kontrollere den, så den delvise n^2
for stoffet øker ikke særlig mye, og vi får en verdi på
delvis n^2=0.79. I motsetning, fordi effekten av stoffet var veldig stor, gjør det en stor forskjell å kontrollere for det, og så når vi beregner den delvise n^2
for terapi kan du se at det stiger til: delvis n^2=0.34.
Forkalring:
Spørsmålet vi må stille oss selv er hva disse deler av n^2 verdier egentlig betyr? Slik jeg generelt tolker det delvise n^2 for hovedeffekten av faktor A er å tolke det som et utsagn om et hypotetisk eksperiment der bare faktor A ble variert. Så selv om vi i dette eksperimentet varierte både A og B, kan vi lett forestille oss et eksperiment der bare faktor A ble variert, og den delvise n^2 statistikk forteller deg hvor mye av variansen i utfallsvariabelen du forventer å se regnskapsført i det eksperimentet.
Hva er forutsetningene til toveis ANOVA?
Som med enveis ANOVA, er nøkkelantakelsene for faktoriell ANOVA varianshomogenitet (alle grupper har samme standardavvik), normalitet av residualene og uavhengighet av observasjonene. De to første er ting vi kan sjekke etter. Den tredje er noe du selv må vurdere ved å spørre om det er noen spesielle sammenhenger mellom ulike observasjoner, for eksempel gjentatte mål hvor den uavhengige variabelen er tid, så det er en sammenheng mellom observasjonene på tid én og tid to: observasjoner på ulike tidspunkt. tidspunkt er fra de samme personene.
Hva er Analyse av kovarians (ANCOVA)?
En variasjon i ANOVA er når du har en ekstra kontinuerlig variabel som du tror kan være relatert til den avhengige variabelen. Denne tilleggsvariabelen kan legges til analysen som en kovariat, i den passende navngitte analysen av kovarians (ANCOVA).
Er en 2x2 ANOVA og lineære regresjonsmodeller det samme?
De har utrolig masse likheter, så på en måte ja. Når du tester, vil du komme fram til det samme
Feks:
Hvis du får en t-verdi i regresjon på 4.65 kan du kvadrere det, altså gange med seg selv og da vil du få F-verdien i en ANOVA test. P-verdien er lik.
Eksempel Figur 14.18 og 14.19
Forklar kort hvordan man regner ut frihetsgrad df2
Denne modellen ville inneholde N parametere totalt, men vi er interessert i forskjellen mellom antall parametere som kreves for å beskrive denne fullstendige modellen (dvs. N) og antall parametere som brukes av den enklere regresjonsmodellen du faktisk er interessert i (dvs.
K+1), og så andre frihetsgrader i F-test er df2=N-K-1, hvor K
er antall prediktorer (i en regresjonsmodell) eller antall kontraster (i en ANOVA). I eksemplet jeg ga ovenfor, er det (N=18)
observasjoner i datasettet og K+1=4 regresjonskoeffisienter knyttet til ANOVA-modellen, så frihetsgradene for residualene er df2 =18-4=14.
Dette er litt vanskelig, så er best å lese nøye også
Eksempel 14.6.5
Hva er en binær kontrast?
Binære kontraster brukes for å skille mellom alle mulige medikamenter (kan være noe annet også, er bare eksempel) som skal testetes.
Hva er en kontrastmatrise?
Hver rad i en tabell tilsvarer ett av faktornivåene, og hver kolonne tilsvarer en av kontrastene. Denne tabellen, som alltid har én rad mer enn kolonner, har et spesielt navn. Det kalles en kontrastmatrise.
Eksempel Tabell 14.11
Det finnes 4 ulike type kontraster, hva er disse?
- Behandlingskontraster
- Helmert kontraster
- Sum til null kontraster
- Valgfrie kontraster i jamovi
Hva er Behandlingskontraster?
I den spesielle typen kontraster som jeg har beskrevet ovenfor, er ett nivå av faktoren spesiell, og fungerer som en slags “baseline”-kategori (dvs. placebo i vårt eksempel, som er brukt i dette kapitellet), som de to andre er definert mot. Navnet på denne typen kontraster er behandlingskontraster, også kjent som “dummy-koding”. I denne kontrasten sammenlignes hvert nivå av faktoren med et basisreferansenivå, og basisreferansenivået er verdien av skjæringspunktet.
Hva er Helmert kontraster?
Imidlertid gir de mest mening i situasjonen når det virkelig er en baseline-kategori, og du vil vurdere alle de andre gruppene i forhold til den. I andre situasjoner eksisterer imidlertid ingen slik grunnlinjekategori, og det kan være mer fornuftig å sammenligne hver gruppe med gjennomsnittet for de andre gruppene. Det er her vi møter Helmert-kontraster.
I Jamovi:
generert av ‘helmert’-alternativet i jamovi ‘ANOVA’ – ‘Contrasts’-valgboksen.
Eksempel Tabell 14.13
Forklar Sum til null kontraster
Det tredje alternativet som jeg kort bør nevne er “sum til null” kontraster, kalt “enkle” kontraster i jamovi, som brukes til å konstruere parvise sammenligninger mellom grupper. Nærmere bestemt koder hver kontrast for forskjellen mellom en av gruppene og en grunnlinjekategori, som i dette tilfellet tilsvarer den første gruppen.
Eksempel Tabell 14.14
Forklar kort hva ideen i Tukeys HSD er
Den grunnleggende ideen i Tukeys HSD er å undersøke alle relevante parvise sammenligninger mellom grupper, og det er egentlig bare hensiktsmessig å bruke Tukeys HSD hvis det er parvise forskjeller du er interessert i.
Tidligere utførte vi for eksempel en faktoriell ANOVA ved bruk av den kliniske studien .csv- datasett, og der vi spesifiserte en hovedeffekt for medikament og en hovedeffekt av terapi, ville vi være interessert i følgende fire sammenligninger:
Forskjellen i humørøkning for personer som får Anxifree versus personer som får placebo.
Forskjellen i humørøkning for personer som fikk Joyzepam versus personer som fikk placebo.
Forskjellen i humørøkning for personer som får Anxifree versus personer som får Joyzepam.
Forskjellen i humørøkning for personer behandlet med CBT og personer som ikke får noen terapi.
Når skal/bør du bruke Tukeys HSD ?
For eksempel, i vårt legemiddeleksempel ovenfor, trodde du kanskje at alle medikamentene ville ha forskjellige effekter på humøret (dvs. du antok en hovedeffekt av medikamentet), men du hadde ingen spesifikk hypotese om hvordan de ville være forskjellige, du hadde heller ingen reell anelse om hvilke parvise sammenligninger som ville være verdt å se på. Hvis det er tilfelle, må du virkelig ty til noe som Tukeys HSD for å gjøre parvise sammenligninger.
Når du ikke bør bruke:
Situasjonen er ganske annerledes, men hvis du virkelig hadde reelle, spesifikke hypoteser om hvilke sammenligninger som er av interesse, og du aldri har noen intensjon om å se på noen andre sammenligninger enn de du spesifiserte på forhånd. Når dette er sant, og hvis du ærlig og strengt holder fast ved dine edle intensjoner om å ikke kjøre noen andre sammenligninger (selv når dataene ser ut som om de viser deg deilig signifikante effekter for ting du ikke hadde en hypotesetest for), da gir det egentlig ikke så mye mening å kjøre noe som Tukeys HSD, fordi det gjør korrigeringer for en hel haug med sammenligninger som du aldri brydde deg om og aldri hadde noen intensjon om å se på.
Det finnes type 1, type 2 og type 3 tester i ANOVA, hvilke bør brukes
Det spørs selvsagt, men type 1 er ofte mest uinteresant. Type I-tester utføres ved gradvis å legge til termer én om gangen, mens type III-tester utføres ved å ta hele modellen og se etter hva som skjer når du fjerner hver term. Begge kan imidlertid ha noen begrensninger. Type I-tester er avhengig av rekkefølgen du legger inn begrepene i, og type III-tester er avhengig av hvordan du koder opp kontrastene dine.
Type II-tester er litt vanskeligere å beskrive, men de unngår begge disse problemene, og som et resultat er de litt lettere å tolke.
SYNS den delen var ekstremt vanskelig skrevet og mange dårlige eksempler, men tror det viktigste er å vite hva det er.