Binomialfordeling & central grænseværdi/estimation Flashcards

1
Q

Beskriv binomialfordelingen

A
  • Binomialfordelingen viser sandsynligheden for x antal succeser ved et antal uafhængige forsøg, når man kigger på to mulige udfald (succes eller fiasko).
  • Binomialfordelingen nærmer sig normalfordelingen, når n er stor.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad kan man bruge binomialfordelingen til?

A

Binomialfordelingen viser (kun), hvor stor sandsynligheden er for at få ”succes” ved et bestemt antal gentagelser

Med andre ord: Binomialfordelingen kan bruges til at beregne sandsynligheder for forskellige muligheder i et Bernoulliforsøg

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er binomialfordelingens modelantagelser?

A
  • Fast antal forsøg (n)
  • Alle forsøg har et binært udfald - succes vs. Fiasko
  • Fast sandsynlighed for succes (p) og fiasko (100-p)
  • Forsøgene er uafhængige
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Forklar elementerne i binomialfordelingens ligning

A
  • (n/x) = fakultet –> hvor mange forskellige måder er der af måder en person kan dø på = de forskellige kombinationer der kan være for succes (død)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er den empiriske middelværdi?

A

Summen af observationer / antal observationer

Ift. terningekast –> antallet af øjne / antallet af personer der kaster

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Beskriv (den empiriske) varians på et enkelt punkt

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er den empiriske standardafvigelse?

A

Man tager kvadratroden af variansen, hvorfor man skal bruge variansen

To punkter på hver sin side af middelværdi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Beskriv (den empiriske) varians på hele datasættet

A

Variansen er gennemsnittet af de kvadrerede forskelle mellem middelværdierne og de enkelte observationer.

dvs. hvor meget spreder observationerne i gennemsnittet sig fra middelværdien/gennemsnittet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad kan man bruge variansen til?

A
  • Giver os en idé om, hvor spredte vores observationer er
  • Variansen benyttes til at beregning standardafvigelse
    • Som bruges til at beregne SE
      • Som bruges til at beregne CI
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er forskellen mellem teoretiske og empiriske størrelser?

A
  • Den empiriske størrelse man får ud af sit datasæt er regnet ud fra ens teoretiske størrelse.
  • De tal jeg får ud i R bygger på en teoretisk værdi, men ER en empirisk værdi.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad kan standardafvigelse bruges til?

A
  • Fortæller noget om, hvor meget data typisk spreder sig omkring middelværdien
  • Bliver bestemt af variansen
  • Standardafvigelse bruges til at bestemme standardfejlen (SE)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er standardfejl (SE)?

A

Formel: standardafvigelse / kvadratroden af n

  • SE siger noget om usikkerheden på vores estimat dvs. hvor sikre vi er på, at værdien ligger inden for den standardiserede data (95% område)
  • Afhænger af standardafvigelsen, som afhænger af variansen
  • SE for estimatet bruges til at beregne konfidensintervallet
  • Jo mindre SE jo smallere konfidensinterval, og når stikprøvestørrelsen bliver større bliver SE mindre
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad er den centrale grænseværdisætning?

A
  • Sætningen: Gennemsnittet af et stort antal uafhængige og identisk fordelte variable vil altid approksimere en normalfordeling.*
  • Jo flere observationer, jo bedre approksimation.*

Det betyder:

  • Jo flere observationer desto smallere konfidensinterval som afhænger af standardfejl, som afhænger af variansen, som afhænger af antallet af observationer.
  • Desto flere observationer der er, desto tættere på en normalfordeling.

Eksempel terninger:

  • Uafhængige variable: resultatet af et kast med terning 1 påvirker ikke resultatet af et kast med terning 2, ligesom udfald af operation 1 ikke påvirker udfaldet på operation 2
  • Identisk fordelte: terning 1 og terning 2 kan begge tage fordelingen 1, 2, 3, 4, 5, eller 6, ligesom operation 1 og operation 2 kan medføre enten en succes eller fiasko
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er estimationsusikkerhed?

A
  • Hænger sammen med standardfejl, der siger noget om et estimats usikkerhed.
  • Usikkerhedsmål: Hvor meget varierer dine observationer fra din middelværdi (variansen) og antallet af observationer (n)
    • Hvis den varierer meget er den mere usikker
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er forskellen mellem middelværdi og gennemsnit?

A

Middelværdien er gennemsnittet i populationen, som vi ville kende, hvis vi havde observeret alle.

Gennemsnittet: Gennemsnittet af stikprøvens observationer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvorfor skal variansen kvadreres (opløftes)?

A

Hvis vi vil sige noget om spredningen for hele datasættet, kan vi summere enkelte afvigelser og dividere med antallet af observationer.

Men det vil altid give 0, så derfor opløfter vi summen af variationen af i anden potens, så vi kun får positive tal

17
Q

Hvad er Bernoulliforsøg?

A

Forsøg med to mulige udfald

18
Q

Når n er stor, hvad gør binomialfordelingen så?

A

Binomialfordelingen nærmer sig normalfordelingen, når n er stor.

19
Q

Beskriv estimation

A

Når man vil udtale sig om store grupper, ud fra små stikprøver, eller sige noget generelt, så estimerer man den sande værdi.

20
Q

Hvad er forskellen mellem variansen og standardafvigelse

A
  • Standardafvigelsen er lig med kvadratroden af variansen, og er dermed ligeledes et mål for variationen omkring middelværdien.
  • Standardafvigelsen har i modsætning til variansen samme enhed som data, hvilket gør tolkning lettere