8 Checking the models I: independence Flashcards
Hvilke assumptions har man for GLM?
- Independence
○ Fundamental i all statistikk- Homogeneity of variance
- Normality of error
- Linearity/additivity
Hvilke konsekvenser får det å bryte assumptions?
Grunnlaget for p-verdien er at assumptions er true. Uten grunnlaget er p-verdien misledende og man vet ikke nøyaktig hvor misledende den er. Hele modellen vil være unøyaktig og full av følgefeil om ikke assumptions er true.
Hva betyr independence?
Independence: datapoints are independent if knowing the
error of one or a subset of datapoints provides no knowledge of the error of any others
“datapoints are independent if knowing the
error of one or a subset of datapoints provides no knowledge of the error of any others”
Hva er dette definisjonen på?
Independence
Når bør man sørge for at independence er tatt hensyn til?
I designstadiet
Hva kan gi utfordringer for independence?
1 Gjentatte målinger
○ Multivariate statistics eller single summary kan brukes for å beholde independence
2 Heterogene data
3 Nested data
Hva betyr det at populasjonen er heterogen?
Det er forskjeller i populasjonen, den er ikke homogen (lik)
Er en heterogen populasjon independent?
Hvis grupperingen innad i et datasett blir ignorert, så er dataene heterogene og dermed ikke independent.
Hva kan man gjøre for å få en heterogen populasjon independent?
Ta hensyn til grupperingen innad i et datasett.
Hvilke konsekvenser kan det gi å utelate en undergruppering?
1 Same conclusion within and between subsets
○ Selv når ikke alle grupperinger tas hensyn til hender det at grunnkonklusjonen forblir den samme, men at da noe info går tapt
2 Creating relationships where there are none
3 Concluding the opposite
Hva betyr repeated measures? Vil variablene være independent hvis man gjør repeated measures?
Måle samme enheten mer enn én gang.
F. eks kan to grupper med 5 griser i hver måles en gang i uken i fire uker. Bonden har da IKKE 40 uavhengige målinger, men 10 (ett sett med målinger per gris). En gris som er stor i begynnelsen av eksperimentet, er sannsynligvis stor i slutten også.
Hvor mange uavhengige målinger har bonden når han måler to grupper med griser fem ganger én gang i uken i fire uker?
10
Hva er viktig å huske ved innsamling av data?
Sørg for at informasjonen du er ute etter kommer med.
Det er bedre å utelate data enn å bryte independence
“multiplicity of p-values” Ved å velge mer enn en metode å analysere dataene, stiger sannsynligheten for å finne en signifikant p-verdi. Dette samsvarer ikke med god forskning.
Hva betyr “multiplicity of p-values”?
Ved å velge mer enn en metode å analysere dataene, stiger sannsynligheten for å finne en signifikant p-verdi. Dette samsvarer ikke med god forskning.
Hva er nested data?
Nested data data inni data. F. eks frø som kommer fra en gren fra en plante.
Hvordan påvirker nested data independence?
Ligner på repeated measures i den forstand at noen målinger vil bli likere enn andre og dermed ikke uavhengige.
Hvordan kan nested data analyseres for å ikke bryte med independence?
Denne type data er hiarkisk og analyseres på en egen måte for å ikke bryte independent assumption.
Hvilke indikatorer har man på non-independence?
- For mange data points
a. Se på error og total df- Et usannsynlig resultat
a. Mange resultater fra få individer kan gjøre en liten forskjell signifikans siden hvert individ får virke inn flere ganger.
3 Repeated measures
- Et usannsynlig resultat