Begrippen Statistiek 1 (H4) Flashcards
Steekproefvariabiliteit
bij een herhaling van de studie, op basis van een nieuwe steekproef, zijn samenvattende maten variabelen omdat hun waarden kunnen variëren van steekproef tot steekproef
Kansmodel
een wiskundige weergave van de werkelijkheid die rekening houdt met de rol van toeval bij de steekproeftrekking. We gebruiken deze modellen om data te genereren die we nadien vergelijken met de waargenomen data
inductieve analyse
verklarende/ inferentiële analyse:
maakt gebruik van kansmodellen om de steekproefvariabiliteit in rekening te brengen. Een inductieve analyse laat ons toe om verder te kijken dan de geobserveerde data, door in rekening te brengen wat er zou gebeuren indien we de studie herhaaldelijk uitvoeren onder gelijkaardige condities.
Toevalsproces
een haalbaar proces waarbij de individuele uitkomsten op voorhand onbekend zijn, maar een patroon vertonen bij voldoende herhalingen. We zullen de data van een wetenschappelijke studie bekijken als een toevalsproces: op voorhand weten we niet welke data we zullen observeren, maar als we de studie herhaaldelijk uitvoeren (op basis van nieuwe steekproeven die aan toeval onderhevig zijn), dan kunnen we wel patronen voorspellen
Experimentele eenheden
de een heden die men in een experimentele studie zal bestuderen en waarvoor men data zal verzamelen
Balanceren
de waarden van een variabele gelijk verdelen over de eenheden. Dit wordt vaak gedaan om mogelijke confounders uit te schakelen
Blinderen
bepaalde informatie wordt tijdens de studie achtergehouden voor personen die betrokken waren bij de studie, om zo ongewenste en onbewuste invloeden te elimineren.
dubbel- geblindeerde studie
zowel de proefpersonen als de proefleider weten niet welke groep, welke materie krijgt
Nulhypothese
een bewering of aanname over het toevalsproces die we naar voeren schuiven en die we wensen te toetsen aan de hand van de data
inductie
op basis van het bijzondere het algemene besluiten
van observatie naar algemene theorie
simuleren
het artificieel nabootsen van een toevalsproces door gebruik te maken van kansmodellen
Inductieve analyse
hierbij willen we inschatten hoe repliceerbaar de resultaten van de studie zijn als we de studie opnieuw kunnen uitvoeren op basis van een nieuwe steekproef. Het toevalsproces dat aanleiding geeft tot de data staat hierbij centraal. Dit toevalsproces gaan we modelleren via een kansmodel. Bij een hypothesetoets modelleren we dit proces in de veronderstelling dat de nulhypothese waar is.
Nulhypothese en alternatieve hypothese
zijn twee complementaire aannames over het toevalsproces. We zoeken bewijs in de data tegen de nulhypothese in het voordeel van de alternatieve hypothese. Het is de conventie om de nulhypothese te schrijven als een gelijkheid en de alternatieve als een ongelijkheid.
parameter
een numerieke eigenschap van het toevalsproces dat we wensen te bestuderen
Kans
de kans op een gebeurtenis is gelijk aan de relatieve frequentie van de gebeurtenis als we het toevalsproces blijvend observeren.
een statistiek
een samenvatting van de gegevens uit de steekproef (bv. gemiddelde, absolute en relatieve frequentie)
toetsingsgrootheid
een statistiek die info geeft over de hypotheses die we wensen te toetsen.
Geobserveerde toetsingsgrootheid
de toetsingsgrootheid die we berekenen op basis van de geobserveerde data
Schatter
een parameter van het toevalsproces kan geschat worden obv een statistiek. Als de parameter een kans is, is de relatieve frequentie de schatter van de kans. De waarde van de schatter berekend obv de steekproef wordt de schatting van de parameter genoemd.
Steekproevenverdeling
de verdeling van een statistiek wanneer we de studie herhaaldelijk uitvoeren obv nieuwe steekproeven.
Kansmodel
een wiskundige benadering van de werkelijkheid die ons kans helpen de werkelijkheid beter te begrijpen en die ons in staat stelt om kansen te berekenen. We gebruiken een kansmodel om de steekproevenverdeling van de toetsingsgrootheid te modelleren
Binomiale verdeling
bij een experiment met twee uitkomsten, ‘succes’ en ‘geen succes’ genoemd, geeft de binomiale verdeling de kans op k successen weer bij n onafhankelijke herhalingen van het experiment. De formule om deze kansen te berekenen wordt gegeven door vergelijking.
nulverdeling
de steekproevenverdeling van de toetsingsgrootheid wanneer we veronderstelling dat de nulhypothese waar is
p- waarde
de kans om een toetsingsgrootheid te observeren die minstens even extreem is als de geobserveerde toetsingsgrootheid in de richting van de alternatieve hypothese indien we veronderstellen dat de nulhypothese waar is.
Binomiaaltoets
een bijzonder geval van een hypothesetoets waarbij gebruik wordt gemaakt van de binomiale verdeling
eenzijdige en tweezijdige alternatieven
de nulhypothese wordt altijd geformuleerd als een gelijkheid, terwijl de alternatieve wordt geformuleerd als ongelijkheid:
1. tweezijdige, 2. linkszijdige alternatieve, 3. Rechtszijdige alternatieve
Statistisch significant
wanneer er in de data bewijs is gevonden om de nulhypothese te verwerpen
Type 1-fout
indien de werkelijkheid de nulhypothese waar is, maar we verwerpen ze op basis van de data
Type 2-fout
indien in werkelijkheid de alternatieve hypothese waar is, maar we verwerpen de nulhypothese niet op basis van de data
betrouwbaarheid
de kans om de nulhypothese niet te verwerpen wanneer de nulhypothese in werkelijkheid waar is
Power
onderscheidingsvermogen
de kans om de nulhypothese te verwerpen wanneer de alternatieve hypothese in werkelijkheid waar is
De power van de binomiaaltoets neemt toe wanneer
- p en p0 meer van elkaar verschillen
- De steekproefgrootte n toeneemt