Binomialfordeling & central grænseværdi/estimation Flashcards

Question 1

Q

Beskriv binomialfordelingen

Answer

A

Binomialfordelingen viser sandsynligheden for x antal succeser ved et antal uafhængige forsøg, når man kigger på to mulige udfald (succes eller fiasko).
Binomialfordelingen nærmer sig normalfordelingen, når n er stor.

Question 2

Q

Hvad kan man bruge binomialfordelingen til?

Answer

A

Binomialfordelingen viser (kun), hvor stor sandsynligheden er for at få ”succes” ved et bestemt antal gentagelser

Med andre ord: Binomialfordelingen kan bruges til at beregne sandsynligheder for forskellige muligheder i et Bernoulliforsøg

Question 3

Q

Hvad er binomialfordelingens modelantagelser?

Answer

A

Fast antal forsøg (n)
Alle forsøg har et binært udfald - succes vs. Fiasko
Fast sandsynlighed for succes (p) og fiasko (100-p)
Forsøgene er uafhængige

Question 4

Q

Forklar elementerne i binomialfordelingens ligning

Answer

A

(n/x) = fakultet –> hvor mange forskellige måder er der af måder en person kan dø på = de forskellige kombinationer der kan være for succes (død)

Question 5

Q

Hvad er den empiriske middelværdi?

Answer

A

Summen af observationer / antal observationer

Ift. terningekast –> antallet af øjne / antallet af personer der kaster

Question 6

Q

Beskriv (den empiriske) varians på et enkelt punkt

Question 7

Q

Hvad er den empiriske standardafvigelse?

Answer

A

Man tager kvadratroden af variansen, hvorfor man skal bruge variansen

To punkter på hver sin side af middelværdi

Question 8

Q

Beskriv (den empiriske) varians på hele datasættet

Answer

A

Variansen er gennemsnittet af de kvadrerede forskelle mellem middelværdierne og de enkelte observationer.

dvs. hvor meget spreder observationerne i gennemsnittet sig fra middelværdien/gennemsnittet

Question 9

Q

Hvad kan man bruge variansen til?

Answer

A

Giver os en idé om, hvor spredte vores observationer er
Variansen benyttes til at beregning standardafvigelse
- Som bruges til at beregne SE
  - Som bruges til at beregne CI

Question 10

Q

Hvad er forskellen mellem teoretiske og empiriske størrelser?

Answer

A

Den empiriske størrelse man får ud af sit datasæt er regnet ud fra ens teoretiske størrelse.
De tal jeg får ud i R bygger på en teoretisk værdi, men ER en empirisk værdi.

Question 11

Q

Hvad kan standardafvigelse bruges til?

Answer

A

Fortæller noget om, hvor meget data typisk spreder sig omkring middelværdien
Bliver bestemt af variansen
Standardafvigelse bruges til at bestemme standardfejlen (SE)

Question 12

Q

Hvad er standardfejl (SE)?

Answer

A

Formel: standardafvigelse / kvadratroden af n

SE siger noget om usikkerheden på vores estimat dvs. hvor sikre vi er på, at værdien ligger inden for den standardiserede data (95% område)
Afhænger af standardafvigelsen, som afhænger af variansen
SE for estimatet bruges til at beregne konfidensintervallet
Jo mindre SE jo smallere konfidensinterval, og når stikprøvestørrelsen bliver større bliver SE mindre

Question 13

Q

Hvad er den centrale grænseværdisætning?

Answer

A

Sætningen: Gennemsnittet af et stort antal uafhængige og identisk fordelte variable vil altid approksimere en normalfordeling.*
Jo flere observationer, jo bedre approksimation.*

Det betyder:

Jo flere observationer desto smallere konfidensinterval som afhænger af standardfejl, som afhænger af variansen, som afhænger af antallet af observationer.
Desto flere observationer der er, desto tættere på en normalfordeling.

Eksempel terninger:

Uafhængige variable: resultatet af et kast med terning 1 påvirker ikke resultatet af et kast med terning 2, ligesom udfald af operation 1 ikke påvirker udfaldet på operation 2
Identisk fordelte: terning 1 og terning 2 kan begge tage fordelingen 1, 2, 3, 4, 5, eller 6, ligesom operation 1 og operation 2 kan medføre enten en succes eller fiasko

Question 14

Q

Hvad er estimationsusikkerhed?

Answer

A

Hænger sammen med standardfejl, der siger noget om et estimats usikkerhed.
Usikkerhedsmål: Hvor meget varierer dine observationer fra din middelværdi (variansen) og antallet af observationer (n)
- Hvis den varierer meget er den mere usikker

Question 15

Q

Hvad er forskellen mellem middelværdi og gennemsnit?

Answer

A

Middelværdien er gennemsnittet i populationen, som vi ville kende, hvis vi havde observeret alle.

Gennemsnittet: Gennemsnittet af stikprøvens observationer

Question 16

Q

Hvorfor skal variansen kvadreres (opløftes)?

Answer

A

Hvis vi vil sige noget om spredningen for hele datasættet, kan vi summere enkelte afvigelser og dividere med antallet af observationer.

Men det vil altid give 0, så derfor opløfter vi summen af variationen af i anden potens, så vi kun får positive tal

Question 17

Q

Hvad er Bernoulliforsøg?

Answer

A

Forsøg med to mulige udfald

Question 18

Q

Når n er stor, hvad gør binomialfordelingen så?

Answer

A

Binomialfordelingen nærmer sig normalfordelingen, når n er stor.

Question 19

Q

Beskriv estimation

Answer

A

Når man vil udtale sig om store grupper, ud fra små stikprøver, eller sige noget generelt, så estimerer man den sande værdi.

Question 20

Q

Hvad er forskellen mellem variansen og standardafvigelse

Answer

A

Standardafvigelsen er lig med kvadratroden af variansen, og er dermed ligeledes et mål for variationen omkring middelværdien.
Standardafvigelsen har i modsætning til variansen samme enhed som data, hvilket gør tolkning lettere