Descriptive/graphic statistic Flashcards

1
Q

Hvad er grafisk statistik?

A
  • En god måde at simplificere analytisk data, og repræsentere det mere visuelt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er et scatter plot?

A
  • Den mest brugte metode til at beskrive eller præsentere data med to variabler (x,y). Man kan enten bruge observeret versus forventet eller man kan bruge det til at sammenligne to målte værdier. Giver en god indikation for spredning mod stigende værdi.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er et dot plot?

A
  • Er bedst til små datasæt, og det er nemt at se datapunkter, der stikker ud. Ved store datasæt kan der ske overlap mellem datapunkterne, hvilket kan forhindres ved stacking af punkterne. X-akse er værdier og y-akse kan inddeles i dage/uger.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er et frekvens histogram?

A
  • Inddeling af antal observationer i hvert interval. Data er inddelt i intervaller af x-aksen, og frekvens på y-aksen. Den er interval sensitiv (ift. størrelse af interval).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er median og kvartiler

A

Q_1 beskriver at 25% af data ligger under denne værdi.
Q_2 også kaldet median, beskriver at 50% af data ligger enten over eller under denne værdi.
Q_3 beskriver at 75% af data ligger under og 25% ligger over denne værdi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er et boxplot

A
  • Er god til håndtering af store datasæt, hvor data inddeles i grupper. Central linje er median for datasæt, toppen og bunden (quartiles) af rektanglen er 50% af datasættet (dispersion), og linjerne udenfor (whiskers) er det mindste og største værdi (range)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er normal probability/distribution?

A
  • Special form for scatter plot (qq plot). Bruges til hurtigt at tjekke om data følger en normal distribution. Hvis data ligger på den fittede linje er de normalfordelt, og hvis ikke, så afviger de fra normalitet. Udover dette kan en graph laves over samme datasæt, for at se det samme.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er deskriptiv statistik?

A
  • Deskriptive parameter til at give information om en population eller sample
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad er sample mean x ̅?

A

Også kaldet arithmetic mean, er middelværdien for et sæt datapunkter. Sample mean er udvalgte værdier fra en population.
x ̅=(∑_(i=1)^n (x_i )/n

Sample mean bruges også til at estimere mean (μ) for en population, hvis sample er repræsentativ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er population mean μ?

A

Middelværdi for alle værdier i en population.

μ=(∑_(i=1)^N (x_i/N)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad er sample variance s^2?

A

Variance beskriver spredningen, og bliver mere brugt i teoretisk statistik, fordi den er unbiased.
Beskriver spredning af datapunkter fra sample mean.
s^2= (∑_(i=1)^n ((x_i-x ̅ )^2 )/(n-1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er population variance σ^2?

A

Beskriver spredningen af datapunkter i et helt datasæt/population.
σ^2 = (∑_(i=1)^n ((x_i-μ)^2 )/n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad er sample standard deviation s?

A

Standard deviation beskriver også spredningen, men bliver oftere brugt, da den har samme enhed, som rådataen, og er biased.
Beskriver spredningen af datapunkter fra sample mean
s=√((∑_(i=1)^n ((x_i-x ̅ )^2)/(n-1))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er population standard deviation σ?

A

Beskriver spredningen af datapunkter i et helt sæt/population
σ = √((∑_(i=1)^n ((x_i-μ)^2 )/n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er coefficient of variance (CV)?

A

En måde at sammenligne spredningen af data mod mean af data. Det bliver ofte brugt, hvis spredningen er proportional med koncentrationen.
CV=s/x ̅
%CV=s/x ̅ ⋅100%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad er standard deviation mean (standard error)?

A

Også kaldet ’standard error’ kigger på random variabler, da hver observation kan være random.
s(x ̅ )=s/√n

17
Q

Hvad er recovery?

A

Ratioen mellem sample mean og population mean. Man tilføjer analyt til et sample og finder ud af, hvor stor en procentdel af det tilføjede som bliver detekteret.

x ̅/μ
recovery%= x ̅/μ⋅100%

18
Q

Hvad er bias?

A

Forskellen mellem sample mean og population mean. Bias er non-random sampling. Hvis specifik vælger svaret fra en lille gruppe, og konkludere at alle må have det samme svar.
x ̅-μ
bias%=(x ̅-μ)/μ⋅100%