H8 Flashcards
Binary (dichotome) variabele
Het heeft twee mogelijke uitkomsten (kop of munt, wel of niet gestemd, goed of fout raden, enz.)
Binomial distribution
Onder bepaalde omstandigheden heeft een willekeurige variabele X die het aantal waarnemingen van een bepaald type telt een kansverdeling
n
(Trials/pogingen) Totaal aantal pogingen. Aantal keer dat bijvoorbeeld de munt wordt opgegooid of hoeveelheid mensen die gaan stemmen
Sampling distribution (van statics)
Kansverdeling die kansen specificeert voor de mogelijke waarden die de statistiek kan aannemen. Verdeling van random variabelen bij statistics
X (dichotome variabele)
Toevalsvariabele die aantal pogingen met ‘succesvolle’ uitkomst weergeeft
Statistic
Getal dat eigenschap van steekproef weergeeft (steekproefproportie/steekproefgemiddelde). Hangt af van de steekproef. Wat je in de ene steekproef vindt, hoef je niet in een andere te vinden
Parameter
Getal dat eigenschap van populatie weergeeft (populatieproportie/populatiegemiddelde)
P ̂
Steekproefproportie = x/n
p_0
Populatieproportie. De kans op succes
Voorwaarden binominale verdeling: (3)
1) n-trials hebben 2 mogelijke uitkomsten (dichotome variabele)
a. Uitkomst van interesse: succes
b. Andere uitkomst: mislukking
c. Binominale random variabele: (X) aantal successen in de n trials
2) Elke trial heeft dezelfde kans op succes (p)
a. Kans op succes is p
b. Kans op mislukking is 1-p
–> Mag ook als n minder dan 10% van de populatiegrootte is
3) De n-trails zijn onafhankelijk
Kans bij binominale verdeling (een dichotome variabele)
- Eerst kijken of je aan de voorwaarden voldoet
- P(X=x)=n¦x∗p^x 〖(1−p)〗^(n−x)
- Binomiaalcoëfficiënt: n¦x= n!/x!(n−x)!
- n!: n factorial
○ Vermenigvuldigen van 1 t/m n (3!=1x2x3= 6) - Probabilities bij 3 dates
○ Succes is 20%, dus 0,20
○ Mislukking is 1-0,20=0,8
○ Bij n=3, x=2 (2 van de 3 dates een succes) = 3!/2!(3−2)! 〖(0,2〗^2 〖)(1−0,2)〗^(3−2)= 6/2∗〖(0,2〗^2)(0,8)^1=0,096
Samenvattende maatregelen kansverdeling bij binominale verdeling (3)
1) (Gewogen) gemiddelde (gemiddelde probability) (μ)
□ μ= np
□ Makkelijker te berekenen bij een binominale verdeling
2) Standaarddeviatie van kansverdeling (grafische weergave) (σ)
□ σ= √(np(1−p))
3) Kansen
□ z= (x−μ)/σ
□ x=μ± zσ
□ Hiermee ook mogelijk om te kijken of het een normaalverdeling is (z=1/2/3)
Normaalverdeling bij binomiale verdeling (3)
- Hoe groter n, hoe meer normaal verdeeld
- Als np en n(1-p) groter of gelijk zijn aan 15
- Dan kan je de tabel gebruiken en interval uitrekenen
Typen verdelingen van proporties (3)
1) Populatieverdeling
a. Verdeling waaruit we steekproef nemen
b. Verdeling waar we eigenlijk in geïnteresseerd zijn
c. Waarden van parameters staan vast, maar zijn meestal onbekend
d. Door steekproef uit populatieverdeling kennis/voorspellingen opdoen over onbekende parameters
e. 30% last van slaapproblemen (1), 70% niet (0). Populatieproportie (P)
2) Dataverdeling
a. Dataverdeling uit 1 steekproef
b. Meestal alleen deze verdeling
c. Zien we in praktijk
d. Beschreven door statistieken zoals steekproevenverdeling of gemiddeldes van steekproef
e. Bij aselecte steekproeven: Hoe groter n, hoe meer dataverdeling lijkt op de populatieverdeling
f. 10 mensen zeggen last te hebben van slaapproblemen (1) en 40 mensen zeggen niet (0). Steekproefproportie van 0,20 (P ̂) –> x/n= 10/50=0,2
3) Steekproevenverdeling
a. Verdeling van alle mogelijke statistic (hypothetisch)
b. Beschrijft hoeverre statistic varieert over verschillende steekproeven
c. Elke statistic heeft een steekproevenverdeling
d. Aselecte steekproeven geeft steekproevenverdeling alle mogelijke waarden van statistics
e. Vertelt hoe dicht de steekproef statistic overeenkomt met onbekende parameter
f. Soort kansverdeling; hoe groot is de kans dat de steekproef voorkomt
g. Gemiddelde en standaard deviatie
- Gemiddelde= p (populatieproportie)
- Standaarddeviatie van steekproevenverdeling (=standaardfout)= √((p(1−p))/n)
- Voor grote n, de steekproefverdeling van de steekproefverhouding is ongeveer normaal verdeeld en gecentreerd rond de populatieverhouding
–> Als np en n(1-p) groter zijn dan 15 dan normaalverdeling
–> Mogelijkheid empirische regel uit te rekenen
h. Populatieproportie in het midden, komt dus vaakst voor
i. Hoe groter n, hoe smaller de steekproevenverdeling