Uge 37 - Lektion 4 - Beskrivende statistik Flashcards

1
Q

Forklar hvad beskrivende statistik er

A

Beskrivende statistik referer til metoder vi kan indsamle vores data på.

Fx. gennem histogrammer, procenter eller gennemsnit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvorfor fungerer statistik?
–> forklar “Central Limit Theory”

A

Grundlæggende siger den centrale grænsesætning, at fordelingen af ​​summen af ​​et meget stort antal tilfældige variable under visse hypoteser nærmer sig en normalfordeling
Da vi ved at der opstår normalfordelinger i mange forskellige kontekster, kan vi på baggrund af et mindre datasæt af information drage inferens på en større befolkning, ved at forstå denne normalfordeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er fundamentet for inferentiel statistik?

A

Fundamentet for inferentiel statistik er at vores observationer er normal fordelte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Forklar Skew, herunder positiv og negativ skew

A

Fordelingen af vores data i forhold til gennemsnittet
Vores data kan enten ligge til højre eller til venstre for gennemsnittet
Hvilken retning vores data bevæger sig påvirker, hvor vores gennemsnit er, og hvordan vores data ser ud som helhed.
Vi skal således være opmærksomme på outliers, hvis skew enten er positiv eller negativ
Til venstre → en positiv skew
Til højre → en negativ skew

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Forklar Kurtosis

A

Omhandler hvor snæver eller hvor bred vores fordeling er
Negativ kurtosis → folk har svaret meget forskelligt
Positiv kurtosis → folk har svaret meget det samme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Forklar central tendens
(og de tre almindelige mål)

A

Handler om hvordan vores gennemsnitlige data ligger.

Der er tre almindelige mål for central tendens:

Middelværdi (the mean)
Gennemsnitsværdien: Man lægger alle tallene sammen (summen) og dividerer med antallet af tal.

Medianen (the median)
Det talmæssige midtpunkt i dataerne

Typetallet (the mode)
Den værdi der forekommer oftest i dataerne
Hvis to tal forekommer lige mange gange, kan der være flere typetaller.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Forklar sammenhængen mellem central tendens og frekvens fordelingen (skew og kurtosis)

A

Den centrale tendens påvirkes af vores frekvensfordeling (skew og kurtosis)

Hvis der er symmetrisk distribution er Mean, Median og Mode det samme.

Så snart dataen begynder at have en positiv eller negativ skew, påvirker det fordelingen af vores Mean, Median og Mode.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Forklar helt overordnet varians

A

Handler helt overordnet hvordan vores normalfordeling ser ud.

Varians kan måle spredningen i ens datasæt. Det angiver, hvor meget de enkelte observationer i datasættet afviger fra gennemsnittet. Jo højere variansen er, desto mere spredning er der i dataene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvilke tre ting kigger vi på i forbindelse med variansen?

A
  1. Rækkevidde (range)
    Forskellen på den mindste og største værdi i vores datasæt
  2. Afvigelse (deviation)
    Vi kigger på forskellen mellem observation og stikprøvegennemsnittet på et individuelt niveau. Dvs. hvor ligger personen i forhold til gennemsnittet
  3. Standardafvigelsen
    Spredningen (standardafvigelsen) af observationerne i et datasæt beskriver, hvor meget observationerne i gennemsnit afviger fra gennemsnittet, dvs. hvor spredte observationerne er. Jo større spredningen er, jo mere spredt er observationerne.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Forklar hvad interkvartilområdet er
(IQR)

A

IQR er der hvor 50% af ens data ligger

Se noter for udregning af IQR

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Forklar hvad IQR3-reglen er

A

Man bruger IQR3-reglen til at undersøge om der er outliers i ens datasæt.

Se noter for udregning af IQR3

How well did you know this?
1
Not at all
2
3
4
5
Perfectly