Descriptive/graphic statistic Flashcards
Hvad er grafisk statistik?
- En god måde at simplificere analytisk data, og repræsentere det mere visuelt
Hvad er et scatter plot?
- Den mest brugte metode til at beskrive eller præsentere data med to variabler (x,y). Man kan enten bruge observeret versus forventet eller man kan bruge det til at sammenligne to målte værdier. Giver en god indikation for spredning mod stigende værdi.
Hvad er et dot plot?
- Er bedst til små datasæt, og det er nemt at se datapunkter, der stikker ud. Ved store datasæt kan der ske overlap mellem datapunkterne, hvilket kan forhindres ved stacking af punkterne. X-akse er værdier og y-akse kan inddeles i dage/uger.
Hvad er et frekvens histogram?
- Inddeling af antal observationer i hvert interval. Data er inddelt i intervaller af x-aksen, og frekvens på y-aksen. Den er interval sensitiv (ift. størrelse af interval).
Hvad er median og kvartiler
Q_1 beskriver at 25% af data ligger under denne værdi.
Q_2 også kaldet median, beskriver at 50% af data ligger enten over eller under denne værdi.
Q_3 beskriver at 75% af data ligger under og 25% ligger over denne værdi.
Hvad er et boxplot
- Er god til håndtering af store datasæt, hvor data inddeles i grupper. Central linje er median for datasæt, toppen og bunden (quartiles) af rektanglen er 50% af datasættet (dispersion), og linjerne udenfor (whiskers) er det mindste og største værdi (range)
Hvad er normal probability/distribution?
- Special form for scatter plot (qq plot). Bruges til hurtigt at tjekke om data følger en normal distribution. Hvis data ligger på den fittede linje er de normalfordelt, og hvis ikke, så afviger de fra normalitet. Udover dette kan en graph laves over samme datasæt, for at se det samme.
Hvad er deskriptiv statistik?
- Deskriptive parameter til at give information om en population eller sample
Hvad er sample mean x ̅?
Også kaldet arithmetic mean, er middelværdien for et sæt datapunkter. Sample mean er udvalgte værdier fra en population.
x ̅=(∑_(i=1)^n (x_i )/n
Sample mean bruges også til at estimere mean (μ) for en population, hvis sample er repræsentativ
Hvad er population mean μ?
Middelværdi for alle værdier i en population.
μ=(∑_(i=1)^N (x_i/N)
Hvad er sample variance s^2?
Variance beskriver spredningen, og bliver mere brugt i teoretisk statistik, fordi den er unbiased.
Beskriver spredning af datapunkter fra sample mean.
s^2= (∑_(i=1)^n ((x_i-x ̅ )^2 )/(n-1)
Hvad er population variance σ^2?
Beskriver spredningen af datapunkter i et helt datasæt/population.
σ^2 = (∑_(i=1)^n ((x_i-μ)^2 )/n
Hvad er sample standard deviation s?
Standard deviation beskriver også spredningen, men bliver oftere brugt, da den har samme enhed, som rådataen, og er biased.
Beskriver spredningen af datapunkter fra sample mean
s=√((∑_(i=1)^n ((x_i-x ̅ )^2)/(n-1))
Hvad er population standard deviation σ?
Beskriver spredningen af datapunkter i et helt sæt/population
σ = √((∑_(i=1)^n ((x_i-μ)^2 )/n)
Hvad er coefficient of variance (CV)?
En måde at sammenligne spredningen af data mod mean af data. Det bliver ofte brugt, hvis spredningen er proportional med koncentrationen.
CV=s/x ̅
%CV=s/x ̅ ⋅100%