Statistik Flashcards by Theis Deschain

Definer kvalitativ data

Opdeler individer i katagorier. Eksempelvis farve, art. Kaldes også nominal skala.

How well did you know this?

Not at all

Perfectly

Definer ordinal data

Ligesom nominalskalaen, men bringer orden i målingerne. Sætter målingerne op i en rækkefølge der giver mening.

How well did you know this?

Not at all

Perfectly

Definer interval data

Som ordinalskala, men hvor der kan erkendes en afstand imellem hvert punkt, som er den samme mellem hvert punkt. Men der findes intet absolut 0-punkt på en interval skala. Eks: Temperatur.

How well did you know this?

Not at all

Perfectly

Definer kvantitativ data

Inkluderer et absolut 0-punkt, hvilket muliggøre at lægge til, trække fra, gange og dividere. Kaldes også ratio skala.

How well did you know this?

Not at all

Perfectly

Definer “Mean-værdi”

Den middelværdi vi får, ved at dividere summen af vores sæt af observationer med antallet af observationer. Det er kun mean der bruger alle informationer i et datasæt.

How well did you know this?

Not at all

Perfectly

Definer “Median-værdi”

Dette er den midterste af vores observationer, efter at de er blevet rankeret i magnitude.
Eks: Vi har følgende observationer: 4, 8, 9, 12, 15, 25, 202. Her er 12 vores median værdi.

How well did you know this?

Not at all

Perfectly

Definer “Mode-værdi”

Også kaldet crude mode. Det er den klasse i en frekvens distrubtion, der indeholder flest observationer.

I en perfekt symmetrisk distrubtion vil mean, median og mode have den samme værdi.

How well did you know this?

Not at all

Perfectly

Definer range, spredning og varians:

Range: Forskellen mellem højeste og laveste observation. Range giver altså ingen informationer om distrubtion.

Spredning: Udregnes direkte udfra alle observationerne.

Varians: Varians er kvadraten til spredningen. – Dvs. spredningen er kvadratroden til varians.

How well did you know this?

Not at all

Perfectly

Hvad er en normalkurve og hvad kan vi bruge den til?

Distrubtionen fra store prøver udtaget fra en enkelt population vil ofte forme en normalkurve -> Symmetrisk, klokkeformet kurve.
Hvis den vertikale akse re-skaleres ved at dividere med antallet af observationer, fås probability density. Totallen af denne er 1. Total areal under kurven er 100%. På hver side vil der være en standardafvigelse. Totalarealet (100%) minus de to standafvigelser (my ± delta) vil så være være vores P-værdi.

Emperisk regel siger:

1) Middelværdi + 1spredningen = dækker 66,6%
2) Middelværdi + 2spredningen = dækker 95%
3) Middelværdi + 3*spredningen = dækker 99%

How well did you know this?

Not at all

Perfectly

Hvad er gældende for henholdvis:

P < 0.05
P < 0.01
P < 0.001

For P gælder det at:
P < 0.05 (signifikant)
P < 0.01 (Highly significant)
P < 0.001 (Very highly significant)

How well did you know this?

Not at all

Perfectly

Hvad antager H0 hypotesen?

Antager at der ikke er nogen signifikant forskel.

How well did you know this?

Not at all

Perfectly

Hvad antager H1 hypotesen?

Antager at der er en signifikant forskel.

How well did you know this?

Not at all

Perfectly

Hvad er type 1 og type 2 fejl?

Type 1 fejl er når H0 bliver afvist, men faktisk er sand. Type 2 fejl er når H0 antages for sand, men faktisk er falsk.

How well did you know this?

Not at all

Perfectly

Hvis vi sætter vores p værdi lavere, hvad vil der så ske med antallet af henholdsvis type 1 og type 2 fejl?

Vi kan reducere risikoen for type 1 fejl ved at sætte vores accepterede P-værdi lavere. Dette vil dog så til gengæld øge risikoen for type 2 fejl.
Vi er normalt mest bekymrede for type-1 fejlene.

How well did you know this?

Not at all

Perfectly

Hvornår kan man bruge parametriske tests?

Når der er normalfordeling

How well did you know this?

Not at all

Perfectly

Non-parametriske test bruges til:

Ordinal og kvalitative data.

Hvad er power?

Et mål for sandsynligheden for at en test drager den rette konklusion. Parametriske test har generelt højere power end non-parametriske. Vi vil normalt gerne have en power på 0,8 eller 0,9.

Hvad er korrelation?

Association mellem variabler kaldes for korrelation. Denne kan være positiv (når en øgning af den ene variabel giver en øgning af den anden variabel) eller den kan være negativ (når en øgning i den ene variabel giver et fald i den anden variabel).

At to variabler korrelere, betyder ikke nødvendigvis at den ene variabel er skyld i den anden variabel.

Hvad kan vi bruge til at måle korrelations kofficienten ?

Den non-parametriske test Spearman Rank Correlation Coffiecient.

Hvad er R^2?

Beskriver til hvilken grad en faktor har indflydelse på vores variabler. (Eksempelvis vægten på en rotte vil være påvirket af hvor meget mad den har i maven og dens alder. R2 beskriver hvor meget disse faktorer hver især påvirker vægten).

Beskriv vores 5 eksperimentielle designs:

Parallel design: Case-control (Vi har to grupper, en med behandling uden sygdom og en med behandling med sygdom).

Overkrydsning: Dyret er sin egen kontrol (positivt fordi det giver høj power, men negativt da det ikke tager højde for tiden).

Latin square: Et n × n array med n forskellige symboler, hver optræder nøjagtig én gang i hver kolonne og række.

Multi-faktoriel: Her bruges ANOVA model

Cohorte: Alle individer er raske ved start og så ser man hvor mange der udvikler sygdom over tid. (Svært at lave statistisk)

Hvad bruges Chi-square test til?

Bruges til at sammenligne frekvenser. Frekvensen vi observere sammenlignes med den forventede frekvens ud fra vores H0-hypotese. G-test kan også bruges i stedet for, denne er nemmere udført.

Hvad bruges X^2 test til?

Når der er to rækker observationer, og ikke kun en. Eksempelvis hvis vi har både art og habitat. Eller alder og køn. Vi kan altså undersøge associationen mellem to variabler

D’Agostino-Pearson Test:

Test for at finde ud af om data er normalfordelte eller ikke. (God, Anbefalet)

Mann-Whitney U-test:

Bruget til kvantitative data (målinger). Tester forskellen af median. Vores udregnede U-værdi skal være mindre end vores kritiske H0 værdi, for at kunne forkaste H0. Non-parametrisk test.

F-test:

Vurderer om spredningen er ens nok til at kunne bruges til parametriske tests. (Samme med Bartleti's test og Brown-Forsythe's test)

T-test:

Forskellen mellem kun 2 grupper. Kan være parret eller ikke-parret.

ANOVA test:

Forskellen mellem ≥ 2 grupper. Kan være parret eller ikke-parret. One/Two/ Three-way.

Definer henholdsvis one-way og two-way ANOVA

One-Way ANOVA: Sammenligner fx højden i 2 gymnasieklasser Two-way ANOVA: Denne laves hvis man fx sammenligner flere end 2 gymnasieklasser på både højde OG vægt.

Hvad betyder det, om det er en paired eller non-paired test?

Paired: Man har to målinger fra samme subject. Fx hjerterate mål hos en person hhv. før og efter han har drukket kaffe. Non-paried: Man har to målinger men fra to forskellige test grupper. Fx måles hjerterate på 10 mennesker før de drikker kaffe og 12 andre menneskers hjerterate måles efter de har drukket kaffe.