Statistik Flashcards

1
Q

Hvad karakteriserer et bakkeformet histogram?

A

Observationer er koncentreret omrking middelværdien, og koncentrationen aftager væk fra den

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er forskellen mellem diskrete og kontinuerte stokastiske variable?


A

Diskrete stokastiske variable: Kan kun antage bestemte værdier (f.eks. antal).
Kontinuerte stokastiske variable: Kan antage enhver værdi inden for et interval (f.eks. vægt, højde).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er en stokastisk variabel?

A

En variabel, der kan antage forskellige værdier med bestemte sandsynligheder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er standardafvigelsen et mål for i et datasæt?

A

Datas spredning omkring middelværdien

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

I en normalfordeling, hvor stor en procentdel af data ligger inden for to standardafvigelser fra middelværdien?

A

95%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad bruges et QQ-plot typisk til?

A

At afgøre, om data følger en bestemt fordeling, fx normalfordeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er binominalfordelingsformlen?

A

P(X=k)=(n,k)p^k(1−p)^n−k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad står n, k og p for i binominalfordelingsformlen?

A

EKS med tal
n=5 (antal forsøg)

k=1 (antal succeser)

p=0,2 (sandsynligheden for succes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad betyder det, når p-værdien i en hypotesetest er meget lille?

A

Hvis p-værdien er meget lille, betyder det, at der er stærk evidens imod nulhypotesen, og vi forkaster den typisk. Det indikerer, at de observerede data er usandsynlige under nulhypotesen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er formålet med en tæthedsfunktion?

A

En tæthedsfunktion viser, hvordan data er fordelt over et kontinuert interval, og arealet under kurven repræsenterer sandsynligheden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad er en vigtig egenskab ved en tæthedsfunktion for kontinuerte variable?

A

Arealet under kurven er altid lig med 1
Korrekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er middelværdien, medianen og modus for en perfekt normalfordeling?

A

I en perfekt normalfordeling er middelværdien, medianen og modus alle lig med hinanden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

I en normalfordeling, hvad er sandsynligheden for at finde en observation, der ligger mere end tre standardafvigelser fra middelværdien?

A

0,3, da tre standardafvigelser fra middelværdien er 99,7

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvilket af følgende kan bruges til at bestemme, om nulhypotesen skal forkastes?

A) T-test
B) Histogram
C) Dataens median
D) Scatterplot

A

T-test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad repræsenterer punkterne i et QQ-plot?

A

De forventede værdier, hvis data følger en bestemt fordeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvilket resultat i et QQ-plot indikerer, at dataene følger en normalfordeling?

A

Punkterne danner en lige linje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Hvad er en sumkurve?

A

En kurve, der viser den kumulative frekvens af observationer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Hvordan kan sumkurven anvendes til at finde sandsynligheden for et interval i et datasæt?

A

Ved at se på forskellen mellem de kumulative frekvenser ved intervallets øvre og nedre grænser.

19
Q

Hvilket af følgende udsagn er korrekt om sumkurven?
A) Den kan kun anvendes til diskrete datasæt
B) Den viser altid en nedadgående tendens
C) Arealet under sumkurven er altid lig med 1
D) Den viser den kumulative frekvens og vokser altid

A

D) Den viser den kumulative frekvens og vokser altid

20
Q

Hvad beskriver et konfidensinterval?

A

Et interval, der indeholder den sande populationsparameter med en bestemt sandsynlighed

21
Q

Hvilken faktor påvirker størrelsen af et konfidensinterval?

A

Antallet af observationer i stikprøven og standardafvigelsen i populationen påvirker størrelsen af konfidensintervallet. Større stikprøve og mindre standardafvigelse vil føre til et smallere konfidensinterval.

22
Q

Hvad betyder et 95% konfidensinterval?

A

At der er 95% sandsynlighed for, at intervallet indeholder den sande parameter (Et 95% konfidensinterval betyder, at hvis vi gentager eksperimentet mange gange, vil 95% af de konstruerede intervaler indeholde den sande populationsparameter.)

23
Q

Hvad repræsenterer binomialkoefficienten (n,k)?

A

Antallet af måder at vælge k succeser i n forsøg

24
Q

Hvordan beregnes binomialkoefficienten?

A

n!/k!(n-k)!

25
Q

Hvad kendetegner T-fordelingen sammenlignet med normalfordelingen?

A

Den har en fladere top og tykkere haler, dette går den mere passende for små stikprøver

26
Q

Hvornår er det passende at bruge T-fordelingen?

A

Når stikprøven er lille (n ≤ 30) og populationen er normalfordelt

27
Q

Hvad er T-fordelingen ofte anvendt til?

A

At estimere populationens middelværdi fra en lille stikprøve

28
Q

Hvad angiver p-værdien i en hypotesetest?

A

P-værdien angiver, hvor sandsynligt det er at observere et resultat, der er mindst lige så ekstremt som det, vi har, under antagelse af at nulhypotesen er sand.

29
Q

Hvilken type test er ofte forbundet med beregningen af p-værdier?

A

T-test

30
Q

Hvad er teststørrelsen i en hypotesetest?

A

Et tal, der repræsenterer den observerede værdi af en statistik under nulhypotesen

31
Q

Hvordan anvendes teststørrelsen til at afgøre, om nulhypotesen skal forkastes?

A

Teststørrelsen sammenlignes med en kritisk værdi for at afgøre, om nulhypotesen skal forkastes.

32
Q

Hvilken type teststørrelse bruges i en T-test?

A

T-værdi

33
Q

Hvordan relaterer p-værdien sig til teststørrelsen?

A

P-værdien beregnes ud fra teststørrelsen

34
Q

Hvornår bruger man T-fordelingen?

A

Til små stikprøver (n <= 30) og hvor spredningen er ukendt

35
Q

What should you always do?

A

THANK BEYÓNCE (she knows…)

36
Q

Hvornår acceptere man nul hypotesen (H0)?

A

Hvis teststørrelsen er blandt de mest sandsynlige udfald omkring middelværdien af fordelingen, accepterer vi nulhypotesen.

37
Q

Hvornår acceptere vi ikke nul hypotesen?

A

Hvis teststørrelsen er blandt de ekstreme udfald i én eller begge haler af fordelingen, forkaster vi nulhypotesen

38
Q

Hvad er et histogram?

A

Et histogram er en grafisk repræsentation af datas fordeling.Mange datasæt har et klokkeformet histogram, hvilket indikerer:

De fleste observationer samles omkring gennemsnittet.
Færre observationer findes, jo længere man bevæger sig væk fra gennemsnittet.

39
Q

Hvad er en tæthedsfunktion?

A

En funktion f(x), der ligner formen af et histogram, kaldes en tæthedsfunktion.

40
Q

Hvad er en ensidet binomial test?

A
41
Q

Hvad er en tosidet binomial test?

A
42
Q

EKSEMPEL: Lad os sige at du gerne vil finde antal succeser for at du får nøjagtig én 6, og vi kaster med en terning 5 gange. Hvilken formel skal du bruge og hvad ville variablerne være i den?

A

Jeg bruger binomialformlen, hvor n = 5, k = 1 og p = 1/6

43
Q
A