Blok 7 Flashcards
kansverdeling
is te zien als een theoretische kans op verschillende uitkomsten. een kans verdeling is dus een wiskundig model
de kans
op een bepaalde uitkomst kan worden gedefineerd als 1 gedeeld door het aantal mogelijke uitkomsten
Kansmodellen
kan je een uitspraak doen over de gehele (doel) populatie, echter blijven ze slechts een benadering van de werkelijkheid
veelgebruikte kansmodellen
- binomiale
- poissonverdeling
- normale en log-normale
binomiale kansverdeling
deze wordt gebruikt bij dichthome processen
1. deze hebben twee uitkomsten. De uitkomst waar je geïnteresseerd in bent noem je succes
2. om de kansverdeling te kunnen bepalen geldt een algemene formule.
Formule kansverdeling binomiale
Pr (X=k) = n ! / k! (n-k) ! x π ^k (1-π) ^ n-k
r (k) = het aantal keer van demogelijkheid waarin we geïnteresseerd zijn
n= aantal keer dat het experiment herhaald wordt (of totaal aantal mensen = grootte steekproef).
p (= π) = de kans op de mogelijkheid waarin we
geïnteresseerd zijn (ook wel proportie genoemd en is vaak de prevalentie).
! = faculteit.
binomiaalcoefficient
geeft het aantal mogelijke volgordes waarin de successen geobserveerd worden. De volgorde waarin je de successen vindt, hangt af van de totaal aantal obervaties en het aantal gezochte successen
productregel voor de onafhankelijkheid
geeft het product weer van de kans op succes en de kans op niet succes. Deze kunnen niet tegelijkertijd plaatsvinden.
Verwachtingswaarde (μ)
kan gezien worden als een gemiddelde van de kansverdeling (ofwel de populatie).
Populatievariantie
staat voor de spreiding in de populatie. Ofwel de afwijking van het gemiddelde. Variantie is het kwadraat van de standaardafwijking
Uitspraken in statistiek
liefer uitspraken naar proportie, omdat die gelijk zijn in zowel de steekproef als de populatie. De aantallen in de steekproef en populatie zijn anders
Voor de verwachtingswaarde betekent dan dat die gelijk is aan de proportie, je hebt dan over verwachte proportie
Variantie formule
σ ^2 = π (1-π) / n
Poissonverdeling
deze wordt gebruikt bij discrete variabelen. Deze variabelen komen 0, 1, 2, 3 … keer voor gedurende een gegeven tijdsinterval of in een bepaald gebied. De gebeurtenis is constant in de tijd of ruimte, maar de gebeurtenissen treden onafhankelijk van elkaar op.
1. de verwachtingswaarde en variantie zijn hetzelfde
2. de verwachtingswaarde lijkt dus op de variantie
formule poisson verdeling
P(X = k) = e^-λ λ^k / k!
Binomiale en poisson verdeling
kunnen op elkaar gaan lijken, maar de spreiding van de binomiale kansverdeling wordt kleiner naarmate een succes zeldzaam is
Normale kansverdeling
Wordt gebruikt bij continue variabelen
1. deze hebben oneindige aantal waarden. Dit zorgt ervoor dat de kans op een bepaald moment per definitie 0 is P (x) = 1/ oneindig = 0
2. er kunnen geen exacte kansen worden berekend, maar wel kansdichtheden.
3. op bais van de verwachtingswaarde en de sd kan een normale kansverdeling gemaakt worden
4. de oppervlakte is niet direct te berekenen
p-waarde
z = X - gemiddelde / standaardafwijking
z-score
standaardnormaal verdeeld met populatiegemiddelde= 0 en standaardafwijking = 1
Z=1.96 of -1.96 is precies 2,5% –> eenzijdige kans
Centrale limietstelling (CLS)
het steekproefgemiddelde (x) volgt een normale verdeling zolang de steekproef groot genoeg is, ongeacht de oorspronkelijke verdeling van de variabele.
1. In het geval van dichotome variabelen kan de binomiale kansverdeling gaan lijken op een normale kansverdeling bij een grote steekproef.
2. Hoe normaler de oorspronkelijke variabele, des te kleiner de benodigde steekproef en dus ook hoe extreem schever de verdeling, hoe meer waarnemingen er nodig zijn.
intermezzo standaarddeviatie
Als een steekproefgemiddelde niet normaal verdeeld is, kun je niet de Z-score gebruiken om kansuitspraken te doen over een individu, maar m.b.v. de CLS kun je wel kansuitspraken doen over een gemiddelde
1. De gemiddelden van meerdere steekproeven zijn namelijk wel normaal verdeeld, ook al zijn de individuele gegevens dat niet, omdat hierbij de CLS kan worden toegepast.
2. De verwachtingswaarde (= gemiddelde van gemiddelden) van die
verdeling kan geschat worden met het steekproefgemiddelde.
3. De spreiding van die verdeling is echter proportioneel aan het aantal observaties waar de steekproefgemiddelden op gebaseerd
zijn.
standaardfout
De spreiding van de verdeling van steekproefgemiddelden rondom het gemiddelde (van de gemiddelden) noemen we de standaardfout.
1. De standaardfout verschilt van de standaarddeviatie. Namelijk, met de standaarddeviatie wordt de spreiding van de individuele
gegevens binnen een onderzoekspopulatie weergegeven. Met de standaardfout wordt de spreiding van gemiddelden van meerdere steekproeven weergegeven.
2. De verdeling van gemiddelden is belangrijk omdat we vaak de kans
willen bepalen dat we een bepaalde steekproef met een bepaald gemiddelde aantreffen.
Log normale verdeling
wordt gebruikt voor continue variabelen die scheef naar rechts zijn verdeeld.
1. Dit is vooral het geval bij waarden die geen waarden < 0 kunnen aannemen, maar juist heel erg naar boven kunnen afwijken (bijv. concentraties van stoffen in bloed).
2. Dan kan het log-normale model een uitkomst bieden. Als je van alle uitkomsten het logaritme neemt, dan is het resultaat een normale verdeling.