Week 4 Flashcards

1
Q

Wat zijn je hypotheses als je kijkt of er een verschil is tussen twee groepen in gemiddelde?

A
  • H0: μd = μ₂ - μ₁ = 0
  • Ha: μd = μ₂ - μ₁ ≠ 0
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is de standaardfout bij het vergelijken van het gemiddelde van twee onafhankelijke groepen? En waar gaat deze standaardfout van uit?

A

se = √s₁²/n₂ + s₂²/n₂
- Hij gaat er va uit dat σ₁ = σ₂.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Waarom is het problematisch om uit te gaan van σ₁ = σ₂ als de Levane’s test laat zien dat ze niet significant afwijken in de steekproef? Wat kan je beter doen?

A
  • Dan accepteer je de nul hypothese
  • Daarom kan je in JASP beter altijd met Welch werken, die er van uit gaan dat σ₁ ≠ σ₂.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is de standaardfout (zonder nul hypothese) voor:
1. Een afhankelijke steekproef met gemiddeldes en een grote steekproef
2. een afhankelijke steekproef met gemiddeldes en een kleine steekproef
3. Een afhankelijke steekproef met proportie en een grote steekproef
4. Een afhankelijke steekproef met proporties en een kleine steekproef
5. Een onafhankelijke steekproef met gemiddelde en een grote steekproef
6. Een onafhankelijke steekproef met gemiddelde en een kleine steekproef
7. Een onafhankelijke steekproef met proporties en een grote steekproef
8. Een onafhankelijke steekproef met proporties en een kleine steekproef

A
  1. Sd / √n
  2. Bootstrap methode
  3. Sd/ √n / Mcnemar’s toets
  4. Binomiale toets
  5. √s₁²/n₁ + s₂²/n₂
  6. Bootstrap methode
  7. √𝜋ˆ₁(1 - 𝜋ˆ₁) / n₁ + 𝜋ˆ₂(1 - 𝜋ˆ₂ / n₂
  8. Fisher’s exacte methods
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is de samengestelde puntschatter? en waarvoor gebruik je hem?

A
  • Je wil de populatieproportie weten om op basis hiervan de se₀ te berekenen.
  • Je hebt Se₀ namelijk nodig in de t-toets
  • Je telt te populaties van beide groepen die je vergelijkt bij elkaar op en ook het aandeel van de uitkomst variabele. Bijvoorbeeld 35/50 en 10/15 maak je 45/65.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe bereken je SE₀ als je twee onafhankelijke steekproeven (proporties) vergelijkt?

A

√𝜋₀(1 - 𝜋₀) / n₁ + 𝜋₀(1 - 𝜋₀) / n₂

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hoe bereken je de z-score als je het verschil tussen twee groepen vergelijkt met de nul hypothese?

A

z = (𝜋ˆ₂ - 𝜋ˆ₁)- 𝜋ˆ₀ / SE₀
- Hierbij is 𝜋₀ = 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat komt er bij kijken als je van univariaat naar bivariant gaat?

A

Dan komt de X er bij kijken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hoe bereken je de covarfiantie van X en Y?
En hoe kom je dan tot de richtingscoëficiënt?

A
  • SSXY = 𝛴(xi – x―) x (yi – ȳ) / n
  • Vervolgens kom je tot r door SSXY / SxSy. Dat zijn de twee standaarddeviaties.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat zijn de richtlijnen om te zeggen hoe sterk een ecovariatie is met r?

A

0.00 - 0.19 is zeer zwak
0.20 - 0.39 is zwak
0.40 - 0.59 is gemiddeld
0.60 - 0.80 is sterk
0.80 - 1.00 is zeer sterk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welke twee modellen laat jasp zien als je regressie analyses maakt?

A
  • Ho geeft het gemiddelde ȳ.
  • H1 geeft het startgetal a en helling b (x)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat zijn de 5 aannames van een regressie analyse? Welke twee kunnen opgelost worden met een grote steekproef

A
  1. Er is een aselecte steekproef.
  2. Er is een lineair verband tussen x en y.
  3. Er is homescedelastisiteit, dus voor elke x-waarde is er een even goede schatting van y. Kan opgelost worden door grote steekproef
  4. De conditionele verdeling van y is voor elke x-waarde normaal verdeeld.
  5. De observaties zijn onafhankelijk van elkaar (onafhankelijke steekproeven)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat zijn de twee beperkingen van regressieanalyse?

A
  • Je kan niet extrapoleren
  • Er is een grote invloed van outliers.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is het verschil tussen covariantie en correlatie coëfficiënt r?

A

Covariantie is niet gestandaardiseerd en r wel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is de formule van de regressielijn voor Populatie en voor steekproef?

A
  • Populatie: Y = ⍺ + βx + 𝜺
  • Steekproef: Ŷ = a + bx (+ e)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Waar staat OLS voor en met welk symbool kan je dit bepalen?

A

OLS = Ordinary least squares.
- Dit gaat er over welke regressielijn de minste fouten heeft (𝜺). Daarvoor doe je 𝜺² en zoek je de laagst mogelijke uitkomst.

17
Q

Hoe bereken je e?

A
  • e = Y - Ŷ
  • Dit staat voor de observatie min de schatting (de fout)
18
Q

Waar staat E(y) voor?

A
  • De expected value van y.
  • Voor elke x is er een expected value van y o.b.v de regressielijn.
19
Q

Wat is de formule voor TSS, SSE en RSS? Wat laat RSS hier zien?

A
  • TSS = Σ(yᵢ - ȳ)²
  • SSE = Σ(yᵢ - Ŷ)²
  • RSS = Σ(Ŷ - ȳ)² = TSS - SSE.
  • RSS laat zien welk deel van de variatie in y door X bepaald wordt. En dit wordt dus door het regressie model verklaard.
20
Q

Wat als RSS = TSS?

A

Dan is het een deterministisch model waarbij X perfect Y kan voorspellen.

21
Q

Hoe bereken je r²?

A

r² = TSS – SSE / TSS = RSS/SSE

22
Q

Waar staat RMSE voor? Welke waarde van RSME hoort bij een deterministisch model?

A
  • Root Mean of Squared Errors.
  • Hoe lager de RMSE, hoe beter het model is.
  • Een perfect model heeft RMSE = 0
23
Q

Wat is de nul hypothese van de regressie analyse?

A
  • H0: Er is geen samenhang tussen X en Y. Dus β = 0.
  • Ha: β ≠ 0
24
Q

Welk symbool staat voor de gestandaardiseerde regressie en waar vindt je heb in Jasp bij regressieanalyse?

A
  • Het staat voor r
  • Hij staat onder “standardised”
25
Q

Waarvoor geeft JASP de 95% BI als je die berekent voor regressieanalyse?

A

Hij berekent de 95% betrouwbaarheidsinterval val de helling (b)

26
Q
  • Wat is de formule van de t-toets bij regressieanalyse in vergelijking met de nul hypothese?
  • En hoe bereken je SE en s?
  • Hoeveel vrijheidsgraden zijn er?
A
  • t = b (-β₀) / se
  • se = s/Σ(x - ẍ)²
  • s = RMSE = √SSE/n–2
  • df = n – 2.
27
Q

Wat is de Marginale verdeling? Hoe wordt deze gedeeltelijk verklaard volgens regressieanalyse?
En wat is de conditionele variatie?

A
  • De marginale verdeling is TSS
  • Dit staat voor de spreiding van een afhankelijke variabele (y)
  • Hij wordt gedeeltelijk verklaard door een lineair verband met onafhankelijke variabele (x). En voor iedere x wordt een specifieke waarde van y voorspeld (Ŷ).
  • De conditionele variatie is wat onverklaard blijft. Dit is het verschil tussen de waarneming yᵢ en de voorspelling Ŷ.
28
Q

Wat laat bij regressie analyse de effectsterkte zien?

A

De r² waarde laat zien in hoeverre de variatie in y verklaard word door x

29
Q

Waar staat p en r voor bij correlatie coëfficiënt

A

p is de populatie correlatie coëfficiënt
r is de steekproef correlatie coëfficiënt