9 Checking the models II: the other three assumptions Flashcards

1
Q

Hva betyr “homogeneity of variance”?

A

Homogeneity of variance fordelingen rundt fitted model er lik i hele modellen.
Er bredden av distribution of the residual konstant? (svaret skal være ja om kriteriet er oppfylt)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er residuals?

A

Residuals forskjellen mellom observert og predikert datapoint.

Mean of residuals er alltid null per definisjon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er error mean square?

A

unexplained variance summarized

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvordan passer EMS (error mean square) til små fitted values?

A

EMS blir for stor for små verdier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvordan passer EMS (error mean square) til store fitted values?

A

EMS blir for liten for store verdier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er normality of error?

A

bellshaped residualsfordeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva er formelen for F-ratio?

A

F-ratio = FMS/EMS, FMS (variabel mean square) EMS (error mean square)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er formelen for EMS?

A

ErrorSS/df for error

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvilken analyser påvirkes av at assumption normality of error brytes?

A

F-ratio som forventer at FMS (variabel mean square) EMS (error mean square) har normally distributed variance og dermed p-verdi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvordan ser ofte survival data ut?

A

Survival data er ofte right skewed og non-Normally distributed data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvilke transformasjoner er vanlig å bruke?

A

Square root-, logaritme-, invers-transformasjoner

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvilken transformasjon er den svakeste?

A

Square root

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvilken variabel transformeres for å oppnå linearity?

A

X- eller Y-variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvilken variabel transformeres for å oppnå homogeneity of variance?

A

Y-variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva kan normal probability plots brukes til?

A
  • Normal probability plots kan oppdage problemer med heterogenitet og variasjon i linearity
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvilken tallverdi har residuals dersom det ikke er variasjon i datasettet?

A
  • Hvis det ikke er variasjon i datasettet, så vil alle residuals-verdiene være 0 og ligge på x-aksen
17
Q

Hva er nullhypotesen til probability plot distribution i JMP?

A

Nullhypotesen for testen er at residuals er normaldistribuert og P-verdien bør være over 0,05 for å godkjenne normal distribution of error-kriteriet

18
Q

Hvordan skal et normal probability plot se ut om det er normalfordeling?

A

En rett linje

19
Q

Hva plottes mot hva i et normal probability plot?

A

Standardised residuals are plotted against the Normal scores.

20
Q

Hvordan kan non-normality oppdages?

A

For å oppdage non-Normality plot histogrammer og normal probability plots av residuals.

21
Q

Hvordan kan man komme nærmere en normalfordeling om residuals ikke er normalfordelt?

A

Transform y-variabel med square root, log eller inverse transformation for å komme nærmere normalfordeling

22
Q

Hvilke transformasjoner bør brukes ved økende varians?

A

Transformer Y-variablen, hvis økende varians, med square root (svak), log eller invers (sterk) for å normalfordele residuals.

23
Q

Hvilke transformasjoner bør brukes ved økende varians?

A

Hvis minkende varians, transformer Y-variabelen med square root eller power (opphøy i 2. eller 3. osv..). Økende varians er mest vanlig i biologi

24
Q

Hvordan løser man heterogenitet og non-normality of error?

A

Det er samme løsning for heterogenitet og non-Normality av error: transformasjon

Prioriter heterogenitet, siden non-Normalitet vil kunne løses med sentralgrenseteoremet: øk sample size

25
Q

Hvordan kan non-normality løses?

A

Transformasjon eller økning av sample size (sentralgrenseteoremet)

26
Q

Hvordan finner man X-variabelen som ødelegger for linearity?

A
  • Plot hver enkelt X-variabel mot Y-variabelen for detektere den som skaper trøbbel
    • Y=X dersom forholdet er lineært
27
Q

Hvordan kan non-linearity løses?

A
  1. Interaksjon
    ○ Hvis ikke-linært, kan en interaksjon prøves mellom to kategoriske variabler
    1. Transformasjon
      ○ Da kan det hende at interaksjonen ikke lenger trengs (sjekk og vurder)
      Fit en polynomial (eks X + X^2)
28
Q

Hva må gjøres før en kan transformere resultatene tilbake i en transformert modell?

A

Ved transformasjon av modell, transformer numrene tilbake etter KI har blitt regnet ut

29
Q

Hvordan velge transformasjon?

A
  1. Sjekk om modellen oppfyller GLM-kriterier
    1. Start med svakeste transformasjon (square root)
    2. Resjekk GLM-kriterier på transformert modell
  2. Ny transformasjon og resjekking eller fortsett analysen

Går også an å regne ut matematisk ved bruk av bl.a. box-cox formel

30
Q

Hva er GLM assumptions?

A

GLM-assumptions
* Independence
○ Små sammenhenger pleier å gå bra det også
* Homogeneity of variance
○ Denne er viktigere enn normality of error
○ Kan ikke akseptere avvik på denne
○ Y kan transformeres for å oppnå denne
* Normality of error
○ Litt avvik fra normaldistribusjonen kan aksepteres
* Linearity/additivity
○ X eller Y kan transformeres for å oppnå denne
* må oppfylle alle kravene for å få en valid modell