1 An introduction to analysis of variance Flashcards
Hva er Model formulae? Gi et eksempel.
Model formulae formler som bruker ord i stedet for tall. Eksempel WEIGHT=SEX om kjønnet predikerer vekten.
* Data variable variabelen som står til venstre som vi ønsker å forklare
* Explanatory variable variabelen som står til høyre som vi tror har en påvirkning på data variable
Det kan være flere forklaringsvariabler, for eksempel alt annet som påvirker vekten som ikke er kjønn (spisevaner, genetikk osv). Dette kommer i kategorien error og oppdatert formel blir WEIGHT = SEX + ERRO
Hva er GLM?
General Linear Models (GLM) en teknikk som bruker model formulae og geometrical analogies til å unngå matematiske detaljer. Regression og ANOVA er innunder GLM.
Hva er ANOVA?
ANOVA analysis of variance. Tester om variance er større mellom behandlingsgrupper enn innad i behandlingsgrupper.
Hva brukes ANOVA til?
Sammenligne flere grupper ved hjelp av variasjonen.
Hvordan regnes variasjonen ut?
Regne ut variasjon:
1. Finn mean
2. Finn deviations som er avstanden fra mean for hvert punkt (summen av disse avstandene blir 0)
3. Square og summer deviations for å få Sum of squares (SS)
Hva er variance?
Variance (s2 i sample, σ2 i populasjonen) måler variability og tar hensyn til størrelsen på datasettet.
is the expectation of the squared deviation of a random variable from its population mean or sample mean. Variance is a measure of dispersion, meaning it is a measure of how far a set of numbers is spread out from their average value.
Hva betyr signifikant?
Significant når er variability mellom gruppene stor nok til at det ikke er tilfeldig.
Hva er grand mean?
Grand mean det regnes ut et felles mean fra alle grupper. (Eks på grupper: behandlet med ab mot inf i bevegelsessystemet, behandlet med ab mot inf i andre deler av kroppen, ubehandlet og så kan man regne ut felles mean av alle lesjonsstørrelse)
Hvordan undersøkes variabiliteten i ANOVA?
1a Finn felles mean for grupper
1b Regn ut sum of squares
§ Se på variasjonen: legger en gruppe seg konsekvent over/under “grand mean/felles mean”?
2a Regn ut mean for hver gruppe
§ Ligger mean for hver gruppe ganske tett og det fortsatt er stor spredning, så forklarer ikke faktoren man undersøker variasjonen
2b Finn sum of squares innad i hver gruppe
Er plottene like langt fra mean nå når mean er spesialtilpasset gruppene?
Hva er SSY, SSE og SSF?
SSY=total sum of squares : deviation fra grand mean, altså totale variasjonen i datasettet (flest kvadrater)
SSE=error sum of squares: all deviation som ikke ligger på hver enkelt gruppe sin mean (varierende antall kvadrater, kan i teorien være 0)
SSF=fertilizer sum of squares (forklaringsvariabelen, kan forkortes annerledes): hvordan gruppemeans avviker fra grand mean (få kvadrater)
Hvordan er forholdet mellom SSY, SSE og SSF?
SSY=SSE+SSF
Hva er degrees of freedom?
Df er antallet uavhengige informasjonskilder som bidrar til statistikken.
Hvor mange df bør det minst være i error?
Det bør være minst 10-20 df i error.
Hva skjer om man har for få df?
Hvis det ikke er noen df, så er parameteren udefinert.
Hva er MS?
Mean square (MS) measure of variability per degrees of freedom. I motsetning til SS er denne ikke addidativ.