hoofdstuk 3 en 4 Flashcards
covariantie (cov)
is een maat voor lineaire samenhang tussen twee variabelen X en Y
intercept (a)
is y - bx
richtingscoëfficiënt of helling (b)
is r maal sY/sX
residu (e)
is het verschil tussen de geobserveerde waarde en haar voorspelling
residuendiagram
is een spreidingsdiagram met e op de verticale as en x op de horizontale as
extrapolatie
is het gebruik van de regressierechte om voorspellingen te doen voor een waarde die buiten het geobserveerde gebied van de verklarende variabele ligt
determinatiecoëfficiënt
is gelijk aan de gekwadrateerde correlatiecoëfficiënt en geeft de proportie weer van de totale geobserveerde variantie in de uitkomstvariabele die verklaard kan worden door wijzigingen in de verklarende variabele
invloedrijke observatie
is een observatie die een grote impact heeft op de regressierechte of de correlatiecoëfficiënt
simpsons paradox
is een bijzonder geval van confounding waarbij de richting van de associatie wijzigt wanneer de confounder in rekening wordt gebracht
steekproefvariabiliteit
is de variatie tussen waarden van steekproef tot steekproef bij een herhaling van de studie op basis van een nieuwe steekproef
een kansmodel
is een wiskundige weergave van de werkelijkheid die rekening houdt met de rol van toeval bij de steekproeftrekking. We gebruiken deze modellen om data te genereren die we nadien vergelijken met de waargenomen data
inductieve/verklarende/inferentiële analyse
is een analyse die gebruikmaakt van kansmodellen om de steekproefvariabiliteit in rekening te brengen. Het laat ons toe om verder te kijken dan de geobserveerde data, door in rekening te brengen wat er zou gebeuren indien we de studie herhaaldelijk uitvoeren onder gelijkaardige situaties
toevalsproces
is een herhaaldelijk proces waarbij de individuele uitkomsten op voorhand onbekend zijn, maar een patroon vertonen bij voldoende herhalingen
experimentele eenheden
zijn de eenheden die men in een experimentele studie zal bestuderen en waarvoor men data zal verzamelen
balanceren van een variabele
is de waarden van een variabele gelijk verdelen over de eenheden om mogelijke confounders uit te schakelen
blinderen
is het achterhouden van bepaalde informatie voor personen betrokken bij de studie om zo ongewenste en onbewuste invloeden te elimineren
dubbel-geblindeerde studie
studie waarbij zowel de proefpersonen als de arts niet weten welke pil het nieuwe medicijn is en welke de placebo
nulhypothese
is een bewering of aanname over het toevalsproces die we naar voren schuiven en die we wensen te toetsen aan de hand van de data
inductie
is op basis van het bijzondere het algemene besluiten
simuleren
is het artificieel nabootsen van een toevalsproces door gebruik te maken van kansmodellen
hypothesetoets
is een toets waarbij we het toevalsproces modelleren in de veronderstelling dat de nulhypothese waar is
alternatieve hypothese
is de complementaire aanname over het toevalsproces van de nulhypothese. Je formuleert ze in termen van ongelijkheid
(populatie)parameter
is een numerieke eigenschap van het toevalsproces dat we wensen te bestuderen
de kans op een gebeurtenis (P())
is gelijk aan de relatieve frequentie van die gebeurtenis als we het toevalsproces blijvend observeren
een statistiek
is een samenvatting van de gegevens uit een steekproef
toetsingsgrootheid (T)
is een statistiek die informatie geeft over de hypotheses die we wensen te toetsen
geobserveerde toetsingsgrootheid (t)
is de toetsingsgrootheid die we berekenen op basis van de geobserveerde data
een schatter
is de relatieve frequentie van de kans
de schatting
is de waarde van de schatter berekend op basis van de steekproef
de steekproevenverdeling
is de verdeling van een statistiek wanneer we de studie herhaaldelijk uitvoeren op basis van nieuwe steekproeven
binomiale verdeling
is een verdeling die de kans op ‘k’ successen weergeeft bij ‘n’ onafhankelijke herhalingen van het experiment
onafhankelijk
is de staat indien de kennis van een waarde van een observatie geen informatie geeft over de mogelijke waarden die een andere observatie kan aannemen
nulverdeling
is de steekproevenverdeling van de toetsingsgrootheid wanneer we veronderstellen dat de nulhypothese waar is
p-waarde
is de kans om een toetsingsgrootheid te observeren die minstens even extreem is als de geobserveerde toetsingsgrootheid in de richting van de alternatieve hypothese indien we veronderstellen dat de nulhypothese waar is
binomiaaltoets
is een bijzonder geval van een hypothesetoets waarbij gebruik wordt gemaakt van de binomiale verdeling
eenzijdige en tweezijdige alternatieven
zijn de alternatieven:
tweezijdige hypothese
linkszijdige hypothese <
rechtszijdige hypothese >
beslissingsregels
zijn regels die een besluit trekken over de hypothesetoets
significantieniveau (alfa)
is de grenswaarde om vast te leggen hoe klein de p-waarde moet zijn om de nulhypothese te verwerpen
statistisch significant bewijs
is het bewijs tegen p0 voor een bepaalde keuze van alfa als wa haar nulhypothese (p=p0) kunnen verwerpen
type 1-fout
is de fout die we maken als we indien in werkelijkheid de nulhypothese waar is, we de nulhypothese verwerpen op basis van de data
type 2-fout
is de fout die we maken als we indien in werkelijkheid de alternatieve hypothese waar is, we de nulhypothese niet verwerpen op basis van de data
de betrouwbaarheid
is de kans om de nulhypothese niet te verwerpen wanneer de nulhypothese in werkelijkheid waar is
power of onderscheidingsvermogen
is de kans om de nulhypothese te verwerpen wanneer de alternatieve hypothese in werkelijkheid waar is