Statistik Flashcards
Definer kvalitativ data
Opdeler individer i katagorier. Eksempelvis farve, art. Kaldes også nominal skala.
Definer ordinal data
Ligesom nominalskalaen, men bringer orden i målingerne. Sætter målingerne op i en rækkefølge der giver mening.
Definer interval data
Som ordinalskala, men hvor der kan erkendes en afstand imellem hvert punkt, som er den samme mellem hvert punkt. Men der findes intet absolut 0-punkt på en interval skala. Eks: Temperatur.
Definer kvantitativ data
Inkluderer et absolut 0-punkt, hvilket muliggøre at lægge til, trække fra, gange og dividere. Kaldes også ratio skala.
Definer “Mean-værdi”
Den middelværdi vi får, ved at dividere summen af vores sæt af observationer med antallet af observationer. Det er kun mean der bruger alle informationer i et datasæt.
Definer “Median-værdi”
Dette er den midterste af vores observationer, efter at de er blevet rankeret i magnitude.
Eks: Vi har følgende observationer: 4, 8, 9, 12, 15, 25, 202. Her er 12 vores median værdi.
Definer “Mode-værdi”
Også kaldet crude mode. Det er den klasse i en frekvens distrubtion, der indeholder flest observationer.
I en perfekt symmetrisk distrubtion vil mean, median og mode have den samme værdi.
Definer range, spredning og varians:
Range: Forskellen mellem højeste og laveste observation. Range giver altså ingen informationer om distrubtion.
Spredning: Udregnes direkte udfra alle observationerne.
Varians: Varians er kvadraten til spredningen. – Dvs. spredningen er kvadratroden til varians.
Hvad er en normalkurve og hvad kan vi bruge den til?
Distrubtionen fra store prøver udtaget fra en enkelt population vil ofte forme en normalkurve -> Symmetrisk, klokkeformet kurve.
Hvis den vertikale akse re-skaleres ved at dividere med antallet af observationer, fås probability density. Totallen af denne er 1. Total areal under kurven er 100%. På hver side vil der være en standardafvigelse. Totalarealet (100%) minus de to standafvigelser (my ± delta) vil så være være vores P-værdi.
Emperisk regel siger:
1) Middelværdi + 1spredningen = dækker 66,6%
2) Middelværdi + 2spredningen = dækker 95%
3) Middelværdi + 3*spredningen = dækker 99%
Hvad er gældende for henholdvis:
P < 0.05
P < 0.01
P < 0.001
For P gælder det at:
P < 0.05 (signifikant)
P < 0.01 (Highly significant)
P < 0.001 (Very highly significant)
Hvad antager H0 hypotesen?
Antager at der ikke er nogen signifikant forskel.
Hvad antager H1 hypotesen?
Antager at der er en signifikant forskel.
Hvad er type 1 og type 2 fejl?
Type 1 fejl er når H0 bliver afvist, men faktisk er sand. Type 2 fejl er når H0 antages for sand, men faktisk er falsk.
Hvis vi sætter vores p værdi lavere, hvad vil der så ske med antallet af henholdsvis type 1 og type 2 fejl?
Vi kan reducere risikoen for type 1 fejl ved at sætte vores accepterede P-værdi lavere. Dette vil dog så til gengæld øge risikoen for type 2 fejl.
Vi er normalt mest bekymrede for type-1 fejlene.
Hvornår kan man bruge parametriske tests?
Når der er normalfordeling
Non-parametriske test bruges til:
Ordinal og kvalitative data.
Hvad er power?
Et mål for sandsynligheden for at en test drager den rette konklusion. Parametriske test har generelt højere power end non-parametriske. Vi vil normalt gerne have en power på 0,8 eller 0,9.
Hvad er korrelation?
Association mellem variabler kaldes for korrelation. Denne kan være positiv (når en øgning af den ene variabel giver en øgning af den anden variabel) eller den kan være negativ (når en øgning i den ene variabel giver et fald i den anden variabel).
At to variabler korrelere, betyder ikke nødvendigvis at den ene variabel er skyld i den anden variabel.
Hvad kan vi bruge til at måle korrelations kofficienten ?
Den non-parametriske test Spearman Rank Correlation Coffiecient.
Hvad er R^2?
Beskriver til hvilken grad en faktor har indflydelse på vores variabler. (Eksempelvis vægten på en rotte vil være påvirket af hvor meget mad den har i maven og dens alder. R2 beskriver hvor meget disse faktorer hver især påvirker vægten).
Beskriv vores 5 eksperimentielle designs:
Parallel design: Case-control (Vi har to grupper, en med behandling uden sygdom og en med behandling med sygdom).
Overkrydsning: Dyret er sin egen kontrol (positivt fordi det giver høj power, men negativt da det ikke tager højde for tiden).
Latin square: Et n × n array med n forskellige symboler, hver optræder nøjagtig én gang i hver kolonne og række.
Multi-faktoriel: Her bruges ANOVA model
Cohorte: Alle individer er raske ved start og så ser man hvor mange der udvikler sygdom over tid. (Svært at lave statistisk)
Hvad bruges Chi-square test til?
Bruges til at sammenligne frekvenser. Frekvensen vi observere sammenlignes med den forventede frekvens ud fra vores H0-hypotese. G-test kan også bruges i stedet for, denne er nemmere udført.
Hvad bruges X^2 test til?
Når der er to rækker observationer, og ikke kun en. Eksempelvis hvis vi har både art og habitat. Eller alder og køn. Vi kan altså undersøge associationen mellem to variabler
D’Agostino-Pearson Test:
Test for at finde ud af om data er normalfordelte eller ikke. (God, Anbefalet)
Mann-Whitney U-test:
Bruget til kvantitative data (målinger). Tester forskellen af median.
Vores udregnede U-værdi skal være mindre end vores kritiske H0 værdi, for at kunne forkaste H0.
Non-parametrisk test.
F-test:
Vurderer om spredningen er ens nok til at kunne bruges til parametriske tests. (Samme med Bartleti’s test og Brown-Forsythe’s test)
T-test:
Forskellen mellem kun 2 grupper. Kan være parret eller ikke-parret.
ANOVA test:
Forskellen mellem ≥ 2 grupper. Kan være parret eller ikke-parret. One/Two/ Three-way.
Definer henholdsvis one-way og two-way ANOVA
One-Way ANOVA: Sammenligner fx højden i 2 gymnasieklasser
Two-way ANOVA: Denne laves hvis man fx sammenligner flere end 2 gymnasieklasser på både højde OG vægt.
Hvad betyder det, om det er en paired eller non-paired test?
Paired: Man har to målinger fra samme subject. Fx hjerterate mål hos en person hhv. før og efter han har drukket kaffe.
Non-paried: Man har to målinger men fra to forskellige test grupper. Fx måles hjerterate på 10 mennesker før de drikker kaffe og 12 andre menneskers hjerterate måles efter de har drukket kaffe.