8 Checking the models I: independence Flashcards
Hvilke assumptions har man for GLM?
- Independence
○ Fundamental i all statistikk- Homogeneity of variance
- Normality of error
- Linearity/additivity
Hvilke konsekvenser får det å bryte assumptions?
Grunnlaget for p-verdien er at assumptions er true. Uten grunnlaget er p-verdien misledende og man vet ikke nøyaktig hvor misledende den er. Hele modellen vil være unøyaktig og full av følgefeil om ikke assumptions er true.
Hva betyr independence?
Independence: datapoints are independent if knowing the
error of one or a subset of datapoints provides no knowledge of the error of any others
“datapoints are independent if knowing the
error of one or a subset of datapoints provides no knowledge of the error of any others”
Hva er dette definisjonen på?
Independence
Når bør man sørge for at independence er tatt hensyn til?
I designstadiet
Hva kan gi utfordringer for independence?
1 Gjentatte målinger
○ Multivariate statistics eller single summary kan brukes for å beholde independence
2 Heterogene data
3 Nested data
Hva betyr det at populasjonen er heterogen?
Det er forskjeller i populasjonen, den er ikke homogen (lik)
Er en heterogen populasjon independent?
Hvis grupperingen innad i et datasett blir ignorert, så er dataene heterogene og dermed ikke independent.
Hva kan man gjøre for å få en heterogen populasjon independent?
Ta hensyn til grupperingen innad i et datasett.
Hvilke konsekvenser kan det gi å utelate en undergruppering?
1 Same conclusion within and between subsets
○ Selv når ikke alle grupperinger tas hensyn til hender det at grunnkonklusjonen forblir den samme, men at da noe info går tapt
2 Creating relationships where there are none
3 Concluding the opposite
Hva betyr repeated measures? Vil variablene være independent hvis man gjør repeated measures?
Måle samme enheten mer enn én gang.
F. eks kan to grupper med 5 griser i hver måles en gang i uken i fire uker. Bonden har da IKKE 40 uavhengige målinger, men 10 (ett sett med målinger per gris). En gris som er stor i begynnelsen av eksperimentet, er sannsynligvis stor i slutten også.
Hvor mange uavhengige målinger har bonden når han måler to grupper med griser fem ganger én gang i uken i fire uker?
10
Hva er viktig å huske ved innsamling av data?
Sørg for at informasjonen du er ute etter kommer med.
Det er bedre å utelate data enn å bryte independence
“multiplicity of p-values” Ved å velge mer enn en metode å analysere dataene, stiger sannsynligheten for å finne en signifikant p-verdi. Dette samsvarer ikke med god forskning.
Hva betyr “multiplicity of p-values”?
Ved å velge mer enn en metode å analysere dataene, stiger sannsynligheten for å finne en signifikant p-verdi. Dette samsvarer ikke med god forskning.
Hva er nested data?
Nested data data inni data. F. eks frø som kommer fra en gren fra en plante.