9 Checking the models II: the other three assumptions Flashcards
Hva betyr “homogeneity of variance”?
Homogeneity of variance fordelingen rundt fitted model er lik i hele modellen.
Er bredden av distribution of the residual konstant? (svaret skal være ja om kriteriet er oppfylt)
Hva er residuals?
Residuals forskjellen mellom observert og predikert datapoint.
Mean of residuals er alltid null per definisjon
Hva er error mean square?
unexplained variance summarized
Hvordan passer EMS (error mean square) til små fitted values?
EMS blir for stor for små verdier
Hvordan passer EMS (error mean square) til store fitted values?
EMS blir for liten for store verdier
Hva er normality of error?
bellshaped residualsfordeling
Hva er formelen for F-ratio?
F-ratio = FMS/EMS, FMS (variabel mean square) EMS (error mean square)
Hva er formelen for EMS?
ErrorSS/df for error
Hvilken analyser påvirkes av at assumption normality of error brytes?
F-ratio som forventer at FMS (variabel mean square) EMS (error mean square) har normally distributed variance og dermed p-verdi
Hvordan ser ofte survival data ut?
Survival data er ofte right skewed og non-Normally distributed data.
Hvilke transformasjoner er vanlig å bruke?
Square root-, logaritme-, invers-transformasjoner
Hvilken transformasjon er den svakeste?
Square root
Hvilken variabel transformeres for å oppnå linearity?
X- eller Y-variabelen
Hvilken variabel transformeres for å oppnå homogeneity of variance?
Y-variabelen
Hva kan normal probability plots brukes til?
- Normal probability plots kan oppdage problemer med heterogenitet og variasjon i linearity
Hvilken tallverdi har residuals dersom det ikke er variasjon i datasettet?
- Hvis det ikke er variasjon i datasettet, så vil alle residuals-verdiene være 0 og ligge på x-aksen
Hva er nullhypotesen til probability plot distribution i JMP?
Nullhypotesen for testen er at residuals er normaldistribuert og P-verdien bør være over 0,05 for å godkjenne normal distribution of error-kriteriet
Hvordan skal et normal probability plot se ut om det er normalfordeling?
En rett linje
Hva plottes mot hva i et normal probability plot?
Standardised residuals are plotted against the Normal scores.
Hvordan kan non-normality oppdages?
For å oppdage non-Normality plot histogrammer og normal probability plots av residuals.
Hvordan kan man komme nærmere en normalfordeling om residuals ikke er normalfordelt?
Transform y-variabel med square root, log eller inverse transformation for å komme nærmere normalfordeling
Hvilke transformasjoner bør brukes ved økende varians?
Transformer Y-variablen, hvis økende varians, med square root (svak), log eller invers (sterk) for å normalfordele residuals.
Hvilke transformasjoner bør brukes ved økende varians?
Hvis minkende varians, transformer Y-variabelen med square root eller power (opphøy i 2. eller 3. osv..). Økende varians er mest vanlig i biologi
Hvordan løser man heterogenitet og non-normality of error?
Det er samme løsning for heterogenitet og non-Normality av error: transformasjon
Prioriter heterogenitet, siden non-Normalitet vil kunne løses med sentralgrenseteoremet: øk sample size
Hvordan kan non-normality løses?
Transformasjon eller økning av sample size (sentralgrenseteoremet)
Hvordan finner man X-variabelen som ødelegger for linearity?
- Plot hver enkelt X-variabel mot Y-variabelen for detektere den som skaper trøbbel
- Y=X dersom forholdet er lineært
Hvordan kan non-linearity løses?
- Interaksjon
○ Hvis ikke-linært, kan en interaksjon prøves mellom to kategoriske variabler- Transformasjon
○ Da kan det hende at interaksjonen ikke lenger trengs (sjekk og vurder)
Fit en polynomial (eks X + X^2)
- Transformasjon
Hva må gjøres før en kan transformere resultatene tilbake i en transformert modell?
Ved transformasjon av modell, transformer numrene tilbake etter KI har blitt regnet ut
Hvordan velge transformasjon?
- Sjekk om modellen oppfyller GLM-kriterier
- Start med svakeste transformasjon (square root)
- Resjekk GLM-kriterier på transformert modell
- Ny transformasjon og resjekking eller fortsett analysen
Går også an å regne ut matematisk ved bruk av bl.a. box-cox formel
Hva er GLM assumptions?
GLM-assumptions
* Independence
○ Små sammenhenger pleier å gå bra det også
* Homogeneity of variance
○ Denne er viktigere enn normality of error
○ Kan ikke akseptere avvik på denne
○ Y kan transformeres for å oppnå denne
* Normality of error
○ Litt avvik fra normaldistribusjonen kan aksepteres
* Linearity/additivity
○ X eller Y kan transformeres for å oppnå denne
* må oppfylle alle kravene for å få en valid modell