Statistik Flashcards
Hvad karakteriserer et bakkeformet histogram?
Observationer er koncentreret omrking middelværdien, og koncentrationen aftager væk fra den
Hvad er forskellen mellem diskrete og kontinuerte stokastiske variable?
Diskrete stokastiske variable: Kan kun antage bestemte værdier (f.eks. antal).
Kontinuerte stokastiske variable: Kan antage enhver værdi inden for et interval (f.eks. vægt, højde).
Hvad er en stokastisk variabel?
En variabel, der kan antage forskellige værdier med bestemte sandsynligheder.
Hvad er standardafvigelsen et mål for i et datasæt?
Datas spredning omkring middelværdien
I en normalfordeling, hvor stor en procentdel af data ligger inden for to standardafvigelser fra middelværdien?
95%
Hvad bruges et QQ-plot typisk til?
At afgøre, om data følger en bestemt fordeling, fx normalfordeling
Hvad er binominalfordelingsformlen?
P(X=k)=(n,k)p^k(1−p)^n−k
Hvad står n, k og p for i binominalfordelingsformlen?
EKS med tal
n=5 (antal forsøg)
k=1 (antal succeser)
p=0,2 (sandsynligheden for succes)
Hvad betyder det, når p-værdien i en hypotesetest er meget lille?
Hvis p-værdien er meget lille, betyder det, at der er stærk evidens imod nulhypotesen, og vi forkaster den typisk. Det indikerer, at de observerede data er usandsynlige under nulhypotesen.
Hvad er formålet med en tæthedsfunktion?
En tæthedsfunktion viser, hvordan data er fordelt over et kontinuert interval, og arealet under kurven repræsenterer sandsynligheden.
Hvad er en vigtig egenskab ved en tæthedsfunktion for kontinuerte variable?
Arealet under kurven er altid lig med 1
Korrekt
Hvad er middelværdien, medianen og modus for en perfekt normalfordeling?
I en perfekt normalfordeling er middelværdien, medianen og modus alle lig med hinanden.
I en normalfordeling, hvad er sandsynligheden for at finde en observation, der ligger mere end tre standardafvigelser fra middelværdien?
0,3, da tre standardafvigelser fra middelværdien er 99,7
Hvilket af følgende kan bruges til at bestemme, om nulhypotesen skal forkastes?
A) T-test
B) Histogram
C) Dataens median
D) Scatterplot
T-test
Hvad repræsenterer punkterne i et QQ-plot?
De forventede værdier, hvis data følger en bestemt fordeling
Hvilket resultat i et QQ-plot indikerer, at dataene følger en normalfordeling?
Punkterne danner en lige linje
Hvad er en sumkurve?
En kurve, der viser den kumulative frekvens af observationer
Hvordan kan sumkurven anvendes til at finde sandsynligheden for et interval i et datasæt?
Ved at se på forskellen mellem de kumulative frekvenser ved intervallets øvre og nedre grænser.
Hvilket af følgende udsagn er korrekt om sumkurven?
A) Den kan kun anvendes til diskrete datasæt
B) Den viser altid en nedadgående tendens
C) Arealet under sumkurven er altid lig med 1
D) Den viser den kumulative frekvens og vokser altid
D) Den viser den kumulative frekvens og vokser altid
Hvad beskriver et konfidensinterval?
Et interval, der indeholder den sande populationsparameter med en bestemt sandsynlighed
Hvilken faktor påvirker størrelsen af et konfidensinterval?
Antallet af observationer i stikprøven og standardafvigelsen i populationen påvirker størrelsen af konfidensintervallet. Større stikprøve og mindre standardafvigelse vil føre til et smallere konfidensinterval.
Hvad betyder et 95% konfidensinterval?
At der er 95% sandsynlighed for, at intervallet indeholder den sande parameter (Et 95% konfidensinterval betyder, at hvis vi gentager eksperimentet mange gange, vil 95% af de konstruerede intervaler indeholde den sande populationsparameter.)
Hvad repræsenterer binomialkoefficienten (n,k)?
Antallet af måder at vælge k succeser i n forsøg
Hvordan beregnes binomialkoefficienten?
n!/k!(n-k)!
Hvad kendetegner T-fordelingen sammenlignet med normalfordelingen?
Den har en fladere top og tykkere haler, dette går den mere passende for små stikprøver
Hvornår er det passende at bruge T-fordelingen?
Når stikprøven er lille (n ≤ 30) og populationen er normalfordelt
Hvad er T-fordelingen ofte anvendt til?
At estimere populationens middelværdi fra en lille stikprøve
Hvad angiver p-værdien i en hypotesetest?
P-værdien angiver, hvor sandsynligt det er at observere et resultat, der er mindst lige så ekstremt som det, vi har, under antagelse af at nulhypotesen er sand.
Hvilken type test er ofte forbundet med beregningen af p-værdier?
T-test
Hvad er teststørrelsen i en hypotesetest?
Et tal, der repræsenterer den observerede værdi af en statistik under nulhypotesen
Hvordan anvendes teststørrelsen til at afgøre, om nulhypotesen skal forkastes?
Teststørrelsen sammenlignes med en kritisk værdi for at afgøre, om nulhypotesen skal forkastes.
Hvilken type teststørrelse bruges i en T-test?
T-værdi
Hvordan relaterer p-værdien sig til teststørrelsen?
P-værdien beregnes ud fra teststørrelsen
Hvornår bruger man T-fordelingen?
Til små stikprøver (n <= 30) og hvor spredningen er ukendt
What should you always do?
THANK BEYÓNCE (she knows…)
Hvornår acceptere man nul hypotesen (H0)?
Hvis teststørrelsen er blandt de mest sandsynlige udfald omkring middelværdien af fordelingen, accepterer vi nulhypotesen.
Hvornår acceptere vi ikke nul hypotesen?
Hvis teststørrelsen er blandt de ekstreme udfald i én eller begge haler af fordelingen, forkaster vi nulhypotesen
Hvad er et histogram?
Et histogram er en grafisk repræsentation af datas fordeling.Mange datasæt har et klokkeformet histogram, hvilket indikerer:
De fleste observationer samles omkring gennemsnittet.
Færre observationer findes, jo længere man bevæger sig væk fra gennemsnittet.
Hvad er en tæthedsfunktion?
En funktion f(x), der ligner formen af et histogram, kaldes en tæthedsfunktion.
Hvad er en ensidet binomial test?
Hvad er en tosidet binomial test?
EKSEMPEL: Lad os sige at du gerne vil finde antal succeser for at du får nøjagtig én 6, og vi kaster med en terning 5 gange. Hvilken formel skal du bruge og hvad ville variablerne være i den?
Jeg bruger binomialformlen, hvor n = 5, k = 1 og p = 1/6