ANOVA 3 Flashcards
Hvorfor trenger vi effektstørrelse i tillegg til en p-verdi?
En p-verdi angir sjansen for å finne gitt F når det faktisk ikke er noen forskjeller mellom gruppene.
Dette er ikke et mål på hvor sterk en effekt er. Signifikans sier ikke noe om hvor mye av variansen vi har forklart.
Vi bør derfor beregne (og rapportere) effektstørrelse.
Hva er effektstørrelse?
En objektiv og vanligvis standardisert mål på styrken av en observert effekt. Det finnes ulike mål på effektstørrelser.
Hva er de tre effektstørrelsene vi har fokusert på (ANOVA)?
Eta-squared = η^2 (Et annet ord for R^2 i sammenhneng med å sammenligne gj.snitt)
Partial eta-squared = η^2(p)
Omega-squared = ω^2
Beskriv de tre effektstørrelsene, og hvordan de skiller seg fra hverandre.
Eta-squared er det samme som forklart varians, og denne kan brukes når vi har en enveis Anova. I en enveis ANOVA så har vi en uavhengig variabel.
Partial eta-squared sier hvor mye varians en variabel forklarer, som ikke forklares av andre variabler i modellen. Denne kan brukes i en faktoriell anova.
Eta-squared er delvis biased fordi den kun er basert på SS fra utvalget og det blir ikke gjort noe justering med tanke på det faktum at vi prøver å estimere effektstørrelsen til populasjonen. Og derfor bruker vi ofte et litt mer komplekst mål som kalles omega-squared. Dette estimatet er ofte mer nøyaktig.
Hva er en ANCOVA?
En ancova er en analyse av en kovarians. En ancova er som en “vanlig ANOVA” der man legger til en kontinuerlig variabel som predikerer avhengig variabel. Denne variabelen kalles en kovariat.
Hva er fordelene med ANCOVA?
Ancova kan redusere feilvarians og redusere effekt av konfunderende variabler.
Hva er estimated marginal means?
Det refererer til de justerte gjennomsnittene for hver gruppe i analysen, kontrollert for effekten av andre variabler i modellen.
Dette er spesielt relevant når du har et mellomgruppedesign med flere uavhengige variabler eller en kovariansanalyse (ANCOVA) hvor det er viktig å justere for kovariater.
Eksempel:
Tenk deg at du undersøker effekten av ulike kostholdstyper (for eksempel lavkarbo, middelhavskost, vegetarisk) på vekttap, samtidig som du kontrollerer for variabler som alder og kjønn. EMM vil gi deg justerte gjennomsnitt for vekttap for hver kostholdstype, som tar hensyn til de andre variablene i analysen, og gir en klarere forståelse av hvordan kostholdet påvirker vekttapet uavhengig av alder og kjønn.
Hva er de 5 reglene for vekting i kontrastanalyse?
Regel 1: Velg logiske kontraster. Husk at du kun skal sammenligne to deler av varians, og hvis en gruppe er blitt er utpekt i en kontrast, bør den gruppen ekskluderes fra eventuelle påfølgende kontraster.
Regel 2: Grupper kodet med positive vekter vil bli sammenlignet med grupper kodet med negative vekter. Så gi en bit variasjon positiv vekt og den motsatte biten negativ vekt.
Regel 3: Hvis du summerer vektene for et gitt konstrast skal resultatet bli 0.
Regel 4: Hvis en gruppe ikke er involvert i en kontrast, gi den automatisk en vekt på 0, som fjerner den gruppen fra kontrasten.
Regel 5: For en gitt konstrast vil vekten gitt til en gruppe i en bit av varins skal være lik antallet grupper i den motsatte biten med varians.
Hva forskjellen mellom parvise sammenligninger og post-hoc tester?
Parvise sammenligninger er en generell tilnærming for å sammenligne hver gruppe med hver annen gruppe.
Post hoc-analyser er spesifikke tester som brukes etter ANOVA for å identifisere hvilke grupper som er forskjellige.
Hva er en forutsetning for ANCOVA?
En ANCOVA forutsetter at regresjonslinjene er homogene, altså parallelle linjer.
Hvis interaksjonen med kovariaten er signifikant, så tilsier det at linjene ikke er parallelle og forutsetningen for homogene regresjonslinjer blir ikke møtt.
Hva er forutsetningene for ANOVA?
Uavhengighet, normalfordelte residualer og homoskedastisitet (lik varians)
Beskriv forutsetningen om uavhengighet.
Observasjonene i de ulike gruppene skal være uavhengige av hverandre.
Dette betyr at verdiene i én gruppe ikke skal påvirke verdiene i en annen gruppe.
Dette blir ivaretatt av designet, slik som randomisering.
Beskriv forutsetningen om normalfordelte residualer og hvordan man kan sjekke dette.
Residualene (forskjellen mellom de observerte verdiene og de verdiene som er predikert av modellen) skal være normalfordelte innenfor hver gruppe.
For å kontrollere dette kan man bruke grafiske metoder som histogram, Q-Q-plott eller statistiske tester for normalitet som Shapiro-Wilk-testen.
Vi kan også se og skjevhet og kurtose. Hvis Z-skår (verdien delt på tilhørende SE) for skjevhet eller kurtose ligger innenfor intervallet [-1,96, +1,96], anses fordelingen for å være tilnærmet normal (på et 95 % konfidensnivå).
Beskriv homoskedastisitet og hvordan man kan sjekke dette.
Variansen i den avhengige variabelen bør være lik på tvers av alle grupper. Dette kalles også homogenitet av varians. Det er residualene som skal være homodeskastiske.
For å teste denne antagelsen kan man bruke Levene’s test (bør ikke være signifikant), eller lage box plot. På box plotten bør lengden fra bunn til topp av whiskers være relativt like og høyden på boksen .
Man kan også se på forholdet mellom gruppen med høyest og lavest varians , og dette forholdet bør være lavere enn 1,5 eller 2 som Field anbefaler. Man deler den høyeste variansen på den laveste. Dette er relatert til en test som kalles Hartleys Fmax.
Hva må man gjøre når forutsetningen om normalfordelte residualer ikke er oppfylt.
Når du ikke har normalfordelte residualer i en analyse (f.eks. i en ANOVA), kan dette påvirke validiteten av resultatene, siden ANOVA antar at residualene er normalfordelte. Her er noen tiltak du kan ta for å håndtere dette problemet:
Uteliggere: Fjern eller vurder uteliggere hvis de påvirker resultatene unormalt mye.
Transformering: Bruk log-, kvadratrot- eller andre transformasjoner for å oppnå normalitet.
Robust ANOVA: Bruk robuste statistiske metoder som kan håndtere brudd på normalitetsforutsetningen.
Ikke-parametrisk test: Hvis transformering ikke hjelper, vurder å bruke en ikke-parametrisk test som Kruskal-Wallis for å sammenligne grupper.
Ved å ta i bruk en av eller flere av disse metodene, kan du håndtere situasjoner der residualene ikke er normalfordelte, og fortsatt trekke gyldige konklusjoner fra analysen.