AKC Flashcards
SLR en MLR
DFM
DFE
DFT
DFM: P
DFE: N-P-1
DFT: N-1
ANOVA One WAY
DFG
DFE
DFT
DFG: i - 1
DFE: N- i
DFT: N-1
ANOVA Two WAY
DFA DFB
DFAB
DFE
DFT
DFA: i - 1 DFB: J - 1
DFAB: ( i - 1 ) * ( J - 1 )
DFE: N - ( i * J )
DFT: N - 1
In het statistische model voor enkelvoudige lineaire regressie (simple linear regression) geldt dat de scores op de afhankelijke y …
a. Afkomstig kunnen zijn van individuen die statistisch afhankelijk zijn, zoals herhaalde metingen voor dezelfde individuen.
b. Altijd normaal verdeeld zijn in de populatie (d.w.z. over alle individuen voor elke score op de predictor x).
c. Populatievarianties hebben die lineair gerelateerd zijn aan de waarden van de predictor x.
d. Populatiegemiddelden hebben die lineair gerelateerd zijn aan de waarden van de predictor x.
d. Populatiegemiddelden hebben die lineair gerelateerd zijn aan de waarden van de predictor x.
In een enkelvoudige lineaire regressie (simple lineair regression) worden verschillende parameters geschat. Welke van de geschatte parameters in een enkelvoudige lineaire regressie is een directie uitdrukking van de sterkte van het lineaire verband tussen de voorspellende variabele x en de afhankelijke variabele y?
a. De gestandaardiseerde helling ofwel standardized slope (b1*)
b. De standaarddeviatie van de residuen (s).
c. De ongestandaardiseerde helling ofwel de unstandardized slope (b1)
d. De correlatie tussen x en y (rxy)
a. De gestandaardiseerde helling ofwel standardized slope (b1*)
We hebben data van een volledig gekruist experimenteel design met Factor A (met 2 niveau’s) en Factor B (met 3 niveaus)
Welke van de volgende uitspraken is FOUT?
a. Een Two-way ANOVA met factor A en Factor B op de data levert dezelfde informatie op als twee one-way ANOVA’s, namelijk een one-way ANOVA met Factor A en een one-way ANOVA met Factor B.
b. In dit experiment wordt de populatie geclassificeerd aan de hand van twee categorische variabelen.
c. In een two-way ANOVA op deze data splitsen we de variantie van de afhankelijke variabele op in variatie door verschillen tussen groepsgemiddelden en door afwijkingen van de individuele waarnemingen ten opzichte van hun groepsgemiddelden.
d. In een two-way ANOVA op deze data wordt de som van de kwadraten van de residuen berekend.
a. Een Two-way ANOVA met factor A en Factor B op de data levert dezelfde informatie op als twee one-way ANOVA’s, namelijk een one-way ANOVA met Factor A en een one-way ANOVA met Factor B.
In een onderzoek hebben we te maken met drie groepen: A, B en C. Welke van de onderstaande sets contrastcoëfficiënten definieert een geldig contrast om te onderzoeken of groep A en B een groter populatiegemiddelde hebben dan groep C?
a. 1, -1, 0
b. 0, 1, -1
c. 0.5, 0.5, -2
d. 1, 1, -2
d. 1, 1, -2
Stel dat je 12 paarsgewijze vergelijkingen van twee gemiddelden met een twee-zijdige t-tets gaat uitvoeren volgens de Bonferonni-methode.
Welke Type I error-niveau per test zou je gebruiken voor elke t-toets, als het overall Type I error-niveau a=0.05 zou zijn?
a. 0.05 / 24
b. 0.05 / 12
c. 0.05 / 6
d. 0.05
b. 0.05 / 12
Behandeld in lecture 9 (M&M 12.2) worked out example
Bonferroni correction adjusts Type-1 error level per tests to a/k, where k is the total number of tests. The total number of tests is given as 12. (12 pairwise comparisons) and =0,05
- Welke van de onderstaande opties is een voorbeeld van een “interactie” in two-way ANOVA?
a. De niveaus van Factor A zijn gekruist met de niveaus van Factor B in het experimentele design van het onderzoek.
b. Het effect van Factor B varieert over de verschillende niveaus van Factor A.
c. Zowel Factor A als Factor B hebben een effect op de responsvariabele.
d. Het effect van Factor B is gelijk voor alle niveaus van Factor A.
b. Het effect van Factor B varieert over de verschillende niveaus van Factor A.
Een onderzoeker besluit om data te verzamelen in batches van n = 25 individuen. Na elke batch wordt de p-waarde berekend en elke keer wordt er getoetst op = 0,05. Zodra een significant resultaat bereikt wordt, wordt er gestopt met de dataverzameling. Waarom is dit problematisch?
a. De kans op Type-l fout wordt op deze manier groter dan 0.05.
b. De aanname van homoscedasticiteit wordt op deze manier geschonden.
c. Het is mogelijk dat zelfs na zeer veel batches er nog geen significant resultaat gevonden wordt. Dit is inefficiënt.
d. Steekproeven van omvang n = 25 zijn te klein om resultaten te verkrijgen die gegeneraliseerd kunnen worden naar de populatie.
a. De kans op Type-l fout wordt op deze manier groter dan 0.05.
Homoscedasticiteit voor residuen houdt in, dat voor iedere waarde van X, de conditionele variantie constant is. = juist/onjuist?
juist
Volgens de assumpties van een lineair regressiemodel, dienen de residuen normaal verdeeld te zijn. = juist/onjuist?
Juist
Een assumptie van het lineaire regressiemodel, is de onafhankelijkheid tussen de voorspellers en de afhankelijke variabele = juist/onjuist?
= onjuist = onafhankelijkheid tussen de waarnemingen/residuen
Multicollineariteit is een sterke correlatie tussen de voorspellers:
= juist/onjuist?
Juist
R^2 berekenen met SS
ssr/sst
wortel van r2 is de correlatie
Overall error rate (bonferroni)
formule
( 1 - ( 1 - a ) tot de macht ^k
K berekenen
formule
K = aantal groepen * (groepen - 1) / 2
Bayesiaanse statistiek
Formule
prior x likelihood / marginal likelihood
Kritieke t* berekenen
DF correlatie
DF slope
DF r^2
DF correlatie: N-2
DF slope: N-p-1
DF r^2: N - 3
Foutenmarge formule
SE * t*