Hoofdstuk 4: De binomiaaltoets Flashcards
Wat is een inductieve analyse?
De Inductieve analyse (verklarende analyse) maakte gebruik van kansmodellen om steekproefvariabliteit
in rekening te brengen.
Een inductieve analyse laat ons toe om verder te kijken dan de geobserveerde data, door in rekening
te brengen indien we de studie herhaaldelijk uitvoeren onder gelijkaardige condities.
Geef het verschil tussen een beschrijvende en inductieve analyse.
Beschrijvende analyse
- Kijken naar de geobserveerde data
- Leren uit de beschrijvende analyse
Inductieve analyse
- Verder kijken dan de data
- Wat gebeurt er als we de studie herhalen?
- Wat gaf aanleiding tot de data?
- Wat zijn de onderliggende processen (toevalsprocessen?
Wat is de steekproefvariabiliteit
Bij een herhaling van de studie, o.b.v. een nieuwe steekproef, zijn samenvattende maten variabel omdat hun waarden kunnen variëren van steekproef tot steekproef
Wat is een kansmodel?
Een wiskundige weergave van de werkelijkheid die rekening houdt met de rol van toeval bij de steekproeftrekking. We gebruiken deze modellen om data genereren die we nadien vergelijken met de waargenomen data.
Wat is een inductieve analyse?
Maakt gebruik van kansmodellen om de steekproefvariabiliteit in rekening te brengen. Een inductieve analyse laat ons toe om verder te kijken dan de geobserveerde data, door in rekening te brengen wat er zou gebeuren indien we de studie herhaaldelijk uitvoeren onder gelijkaardige condities.
Om dit te realiseren zullen we verkregen data beschouwen als een momentopame van een toevalsprocess
Geef het verschil tussen een beschrijvende analyse en een inductieve analyse.
- Bij beschrijvende analyse staat de variabiliteit in één dataset, de wargenomen data, centraal
- Bij indictieve analysys staat de variabiliteit tussen datasets centraal, waarbij de datasets worden verkregen door de studie herhaaldelijk uit te voeren. De datasets worden niet waargenomen omdat we de studie niet daadwerkelijk zullen herhalen. Kansmodellen zyssle ons in staat stellen de niet waargenomnn data te beschrijven
Wat is het toevalsproces?
Een haalbaar proces waarbij de individuele uitkomsten op voorhand onbekend zijn, maar een patroon vertonen bij voldoende herhalingen. We zullen de data van een wetenschappelijke studie bekijken als een toevalsproces: op voorhand weten we niet welke data we zullen observeren, maar als we de studie herhaaldelijk uitvoeren (o.b.v. nieuwe steekproeven die aan het toeval onderhevig zijn) dan kunnen we de patronen voorspellen.
Wat zijn experimentele eenheden?
De eenheden (vaak personen) die men in een experimentele studie zal bestuderen en waarvoor men data zal verzamelen.
Hoe kunnen we een variabele balanceren?
Door de waarden van een variabele gelijk te verdelen over de eenheden. Dit wordt vaak gedaan om mogelijke confounders uit te schakelen
Hoe kunnen we een variabele blinderen?
Bepaalde informatie wordt tijdens de studie achtergehouden voor de personen betrokken bij de studie, om zo ongewenste en bewuste invloeden te elimineren.
Blinderen komt vaak voor bij klinische studies waarbij men een nieuw medicijn wilt vergelijken met een placebo. Zowel de proefpersonen als de arts weten niet welke pil het nieuwe medicijn is en welk de placebo. Dit wordt een dubbel-geblindeerde studie genoemd.
Wat is een nulhypothese?
Een bewering of aanname over het toevalsproces die we naar voren schuiven en die we wensen te toetsen a.d.h.v. de data
Wat betekent inductie?
o.b.v. het bijzondere het algemene besluiten
Wat betekent deductie?
= komt uit de logica, er worden een conclusie afgeleid uit veronderstellingen
Wat is simuleren?
het artificieel nabootsen van een toevalsproces door gebruik te maken van kansmodellen
Hoe passen we de nulhypothese toe bij een inductieve analyse?
Bij een inductieve analyse willen we inschatten hoe repliceerbaar de resultaten van de studie zijn als we de studie opnieuw zouden kunnen uitvoeren o.b.v. een nieuwe steekproef. Het toevalsproces dat aanleiding geeft tot de data staat hierbij centraal. Dit toevalsproces gaan we modelleren via een kansmodel. Bij een hypothesetoets modelleren we dit proces in de veronderstelling dat de nulhypothese waar is
Pas de stappen van de hypothesetoets toe op het onderzoek naar morele intuïtie
- Een nulhypothese formuleren: Baby’s hebben geen voorkeur
- Data observeren: 14 van de 16 baby’s kiezen voor de helper
- Data simuleren wanneer de nulhypothese waar is: We werpen 16 keer een geldstuk op en noteren het aantal keer kop. We herhalen ddit 10 000 keer
- De toetsingsgrootheid van de geobserveerde data vergelijken met de toetsingsgrootheden van de gesimuleerde data
- Besluit: de geobserveerde toetsingsgrootheid is niet compatibel met de gesimuleerde toetsingsgrootheden. Dit levert bewijs dat het weinig waarschijnlijk is dat beide poppen even vaak gekozen worden
Geef de 5 stappen van het toefalsproces en de hypothesetoets.
- Hypothese formuleren
- Toetsingsgrootheid vastleggen ( = koppeling met hypothese en data)
- Toevalsproces modelleren ( = kansmodellen gebruiken om het onderzoek artificieel te
herhalen) - Nulverdeling opstellen (= wereld waarin de nulhypothese waar is, simuleren via het
toevalsproces) - ‘p’-waarde berekenen en interpreteren (= bewijskracht tegen de nulhypothese evalueren)
Wat zijn de nulhypothese en de alternatieve hypothese?
De nulhypothese en de alternatieve hypothese zijn 2 complementaire aannames over het toevalsproces. We zoeken bewijs in de data tegen de nulhypothese in het voordeel van de alternatieve hypothese. Het is de conventie om de nulhypothese steeds te schrijven in termen van en gelijkheid en de alternatieve hypothese in ermen van ongelijkheid.
Wat is een parameter?
Een numerieke eigenschap van het toevalsproces dat we wensen te bestuderen. Dit wordt ook een populatieparameter genoemd
Wat is de kans van een gebeurtenis?
is gelijk aan de relatieve frequentie van die gebeurtenis als we het toevalsproces blijvend observeren. Symbolisch stellen we dit voor als P(A), wat je moet lezen als ‘de kans dat gebeurtenis A zich voordoet’. Als A het werken vn kop voorstelt, dan geld P(A) = P(kop werpen) = 0.5. Als we een (eerlijk) geldstuk vele malen na elkaar opwerpen, zullen we in de helft van de gevallen kop werpen. Aks A het werpen is van 4 met een dobbelsteen, dan geldt: P(A) = P(4 werpen) = 1/6. Als we een dobbelsteel velen malen na elkaar werpen, zullen we in een zesde van de gevallen een 4 werpen. De kans op een gebeurtenis is een voorbeeld van een parameter.
Wat is een statistiek?
een samenvatting van de gegevens uit een steekproef. Voorbeelden zijn de absolute frequentie, de relatieve frequentie, het gemiddelde, de standaardafwijking en de correlatiecoëfficiënt.
Wat is een toetsingsgrootheid?
Een statistiek die informatie geeft over de hypotheses die we wensen te toetsen. We noteren ze met letter T
Wat is de geobserveerd toetsingsgrootheid?
De toetsingsgrootheid die we berekenen o.b.v. de geobserveerde data. We noteren ze met een kleine letter t
Leg de schatter en schatting van een parameter uit.
Een parameter van het toevalsproces kan geschat worden op basis van een statistiek. Als de parameter een kans is, is de relatieve frequentie de schatter van deze kans. De waarde van de schatter berekend op basis van de steekproef wordt de schatting van de parameter genoemd.
Wat is een steekproefverdeling?
de verdeling van een statistiek wanneer we de studie herhaaldelijk uitvoeren o.b.v. nieuwe steekproeven
Wat is een kansmodel?
Een wiskundige benadering van de werkelijkheid die ons kan helpen de werkelijkheid beter te begrijpen en die ons in staat stelt om kansen te berekenen. We gebruiken een kansmodel om de steekproevenverdeling van de toetsingsgrootheid te modelleren
Wat is een binomiale verdeling?
Bij een experiment met 2 uitkomsten, vaak ‘succes’ en ‘geen succes’ genoemd, geeft de binomiale verdeling de kans op k successen weer bij n onafhankelijke herhalingen van het experiment. Wanneer p=0.5 kun he denken aan het opwerpen van een geldstuk als experiment
Wanneer zijn observaties onderling afhankelijk?
indien kennis van een waarde van een observatie geen informatie geeft over de mogelijke waarden die een andere observatie kan aannemen.
Voorwaarden:
* De binomiale verdeling zal een geode beschrijving geven van het toevalsproces als de observaties onderling onafhankelijk zijn
Wat is een nulverdeling?
= de steekproevenverdeling van een toetsingsgrootheid wanneer we veronderstellen dat
de nulhypothese waar is.
Wat is statistische significantie?
Statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun resultaten op toeval gebaseerd zijn. Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans).
Statistische significantie is enigszins willekeurig, omdat je zelf de drempelwaarde (alfa) kiest. De meest voorkomende drempel is p < 0.05, wat betekent dat de kans 5% is dat de resultaten worden gevonden terwijl de nulhypothese waar is. Een andere drempel die vaak wordt gekozen is p < 0.01.
Als de p-waarde lager is dan de gekozen alfa-waarde, mag je stellen dat het resultaat van de toets statistisch significant is.
Wat is de p-waarde?
- De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.
- de kans om een toetsingsgrootheid te observeren die minstens even extreem is als de geobserveerde toetsingsgrootheid in de richting van de alternatieve hypothese indien we veronderstellen dat de nulhypothese waar is.
Leg het verschil uit tussen eenzijdig en tweezijdig toetsen
De nulhypothese wordt altijd geformuleerd als een gelijkheid H0: p=0.5 terwijl de alternatieve hypothese wordt geformuleerd als een ongelijkheid. We hebben 3 keuzes voor de alternatieve hypothese:
1. De tweezijdige HA: p≠0.5
2. De eenzijdige HA: p<0.5 (linkszijdig alternatieve hypothese, de waarden van p liggen links van 0.5)
3. De eenzijdige HA: p>0.5 (rechtzijdige alternatieve hypothese, waarden van p liggen rechts van 0.5)
Geef de beslissingsregels van de p-waarde
Het significantieniveau α is de grenswaarde om vast te leggen hoe klein de p-waarde moet zijn om H0 te verwerpen.
- Als de p-waarde ≤ α dan verwerpen we H0
- Als de p-waarde > α dan verwerpen we H0
Wat is een type 1-fout?
H0 is waar en op basis van de data verwepen we H0
Wat is een type 2-fout?
HA is waar en op basis van de data verwerpen we H0 niet.
Wat is het effect van de t-waarde (significantie) op de manier van toetsen?
Wanneer de t-waarde positief is, toets je rechtszijdig. Is de t-waarde negatief? Dan toets je linkszijdig.
Wat is de betrouwbaarheid?
De kans om de nulhypothese niet te verwerpen wanneer de nulhypothese in werkelijkheid waar is
Wat is Power (onderscheidingsvermogen?
De kans om de nulhypothese te verwerpen wanneer de alternatieve hypothese in werkelijkeheid waar is.
Hoe is de kans op een type 1 fout?
De kans op een type 1 fout is gelijk aan het significantieniveau α
Wanneer neemt de Power van de binomiaaltoets toe?
De power van de binomiaaltoets voor H0: p=p0 en HA: p≠p0 neemt toe wanneer:
1. p en p0 meer van elkaar verschillen
2. de steekproefgrootte n toeneemt
Waarom nemen we nooit Alpha = 0?
Hoe kleiner alpha hoe groter de kans op ene type-2 fout
Waarom wilt een grote p-waarde niet perse zeggen dat ne nulhypothese waar is?
Aangezien we beide verschillende uitkomsten hebben gevonden. Het is niet omdat de waarde compatibel is
met de data dat dit de enige waarde is die compatibel is. 0.5 en 0.6 zijn hier beide compatibel. Maar wil niet zeggen dat alleen die ene juist is.
Stel dat de kans op een type 1-fout gelijk ik aan 5%. Was is de betekenis hiervan?
Nog steeds is er 5% kans om onterecht de nulhypothese te verwerpen.
Kleine p-waarden van 0.04 of 4% —> deze is kleiner dan 5% (alpha) dus we verwerpen de nulhypothese niet.
Type 2-fout – in werkelijkheid p : 0.8 en we toetsen H0 : p = 0.5
Waarom kiezen we alpha klein?
- Kleine p-waarden wijze op sterke bewijskracht tegen de nulhypothese
- We de kans op een type-1 fout klein willen houden
Welke misvattingen zijn er rond p-waarden?
P-waarde geeft de kans dat de nulhypothese waar is.
- Dit is niet correct: de nulhypothse is 100% waar of ze is 100% niet waar. De p-waarde geeft de kans, in de veronderstelling dat de nulhypothese waar is, dat we een toetsingsgrootheid observeren die minstens evenveel in de rechting van de alternatieve hypothese wijst als de geobserveerde toetsingsgrootheid
Een p-waarde kleiner dan of gelijk aan alpha imliceert dat H0 fout is.
- Het kan zijn dat H0 fout is, maar dit kunnen we niet met zekerheid zeggen. Het is ook mogelijke dat de nulhypothese juist is en dat we een type 1-fout maken. Of het is ook mogelijk dat de voorwaarde niet opgaat. Zoals je in middels weet, wordt de p-waarde berekend door gebruik te maken van de binominale verdeling, en deze verdeling zal het toevalsproces maar goed beschrijven indien de observaties onafhankelijk zijn. Een kleine pwaarde kan ook wijzen op het feit dat de binominale geen goede beschrijving is omdat observaties afhankelijk zijn. Samengevat kan een kleine p-waarde wijzen op bewijs tegen de nulhypothese, maar ze kan ook het gevolg zijn van afhankelijkheid, of we kunnen een type-1 fout maken. Een kleine p waarde impliceert dus niet altijd dat de nulhypothese fout is.
Een p-waarde groter dan alpha impliceert dat de nulhypothese juist is.
- Nee, een grote p-waarde geeft enkel aan dat de data niet ongewoon zijn indien nulhypothese en alle assumpties opgaan. Het is mogelijk dat de data ook niet ongewoon zijn voor alle nulhypotheses, of dat we een type 2-fout maken, of dat niet voldan is aan de voorwaarde van onafhankelijkheid.
Een p-waarde kleiner dan of gelijk aan alpha impliceert een belangrijke wetenschappelijke bevinding.
- Nee, ze geeft enkel bewijs tegen de nulhypothese (als de observaties onafhankelijk zijn), maar mogelijk is de nulhypothese niet relevant.