AVV Blok 6 Flashcards

1
Q

Doel variantieanalyse

A

Verschillen analyseren bij 2 of meer groepen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Drie voorwaarden variantieanalyse

A
  • Populaties normaal verdeeld
  • Steekproeven hebben gelijke waarnemingen
  • Ongeveer gelijke varianties
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Toets voor gelijkheid varianties

A

H0: σ12 = σ22 = … σa2
Ha: σ12 ≠ σ22 ≠ … σa2

Toets van Hartley; grootste variantie delen door kleinste

m-1 en a

Geen gelijkheid van varianties? Geen variantieanalyse uitvoeren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Doel enkelvoudige lineaire regressie

A

Voorspellen of verklaren van de afhankelijke variabele uit de onafhankelijke variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Regressievergelijking opstellen

A

Yi= de constante coefficient + de richtingscoefficient x voorspellers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Proportie verklaarde variantie in Y (regressiemodel)

A

R2: KS regressie : KS totaal
R2 = 1 -> sterk verband tussen X en Y
R2= 0 -> geen verband X en Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wanneer T toets?

A

Is er significante samenhang of relatie tussen X en Y?
Voorspelt de x variabele een significant deel van de y-variabele?
Voor afzonderlijke variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wanneer F toets?

A

Voorspelt ons regressiemodel een significant deel van de variantie in Y?

Toets of er significante verschillen zijn tussen de behandelingen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Uitvoering T toets

A

H0: β1 = 0
Ha: β1 ≠ 0

Richtingscoefficient regressievergelijking - B : se

n-p-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wanneer we mogen we lineaire regressie gebruiken?

A
1. Lineariteit: er moet een lineair 
verband zijn tussen X en Y 
2. Homoskedasticiteit: constante 
variantie van de residuen (Sd2)
3. Normaliteit: de residuen zijn 
normaal verdeeld
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Doel meervoudige lineaire regressie

A

Onderzoeken van verband tussen Y en meerdere onafhankelijke variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Turkey HSD doel

A

Onderlinge vergelijking van variabelen

Tussen welke behandelingen bestaan significante verschillen?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Uitvoering Turkey HSD

A

Trek twee random gemiddelde van elkaar af en deel door wortel GKS binnen gedeeld door m

m staat voor aantal groepen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Rijeffecten berekenen

A

van elke rijgemiddelde het algemene rijgemiddelde aftrekken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kolomeffecten berekenen

A

kolomgemiddeldes - algemeen rijgemiddelde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

interactie effecten berekenen

A

getal - bijbehorende rijgemiddelde - bijbehorende kolomgemiddelde + algemeen rijgemiddelde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

b

A

aantal kolommen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

KS rij

A

rijeffecten gekwadrateerd en opgeteld x (mensen in de groep x aantal rijen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

KS kolom

A

kolomeffecten gekwadrateerd en opgeteld x (mensen in de groep x aantal kolommen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

KS interactie

A

interactie effecten gekwadrateerd en opgeteld x mensen in de groep

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

p

A

aantal onafhankelijke variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Bereken B

A

Neem de wortel van GKS totaal, dit is de standaarddeviatie, neem de andere standaarddeviatie en deel dit door elkaar. Doe dit keer de wortel va R2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

GKS totaal is

A

de totale variantie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

De wortel van de variantie is

A

de standaarddeviatie

25
Regressievergelijking maken en gebruiken
Kijk naar de bekende variabelen begin met de waarde bij b0 tel vervolgens de andere waardes op nadat je ze hebt vermenigvuldigd. Stel er is een waarde van 1,6 bij leeftijd, dan doe je deze keer 20 wanneer iemand 20 jaar is.
26
F toets voor groep van variabelen
gebruiken bij multicollineariteit | trek de twee R2 van elkaar af en deel door k. en deel daarna nog een keer
27
a
aantal groepen of aantal rijen
28
m
aantal waarnemingen per groep
29
n
totaal aantal respondenten
30
KS tussen berekenen
(gemiddelde van de groep - gemiddelde totaal)^2 voor elke groep bij elkaar op tellen
31
GKS tussen berekenen
KS tussen : aantal df
32
Zuivere schatter
Binnenvariantie, vrij van systematische afwijkingen; lijkt het meest op de populatievariantie
33
KS binnen berekenen
individuele waarnemingen - gemiddelde) ^2 voor elke rij voor elke kolom voor elk individu
34
Rij effect berekenen
rij gemiddelde - totaal gemiddelde
35
kolom effect berekenen
kolom gemiddelde - totaal gemiddelde
36
interactie effect berekenen
gemiddelde combinatiecel - kolom gemiddelde - rij gemiddelde + totale gemiddelde
37
Waarom GKS residu berekenen?
Om te testen hoe goed de voorspellingen zijn op basis van het regressiemodel. Hoe lager de GKS residu, hoe beter de regressielijn past in de puntenwolk, dus hoe beter de voorspellingen
38
GKS residu berekenen
(daadwerkelijke waarneming - geschatte waarneming)^2, doe dit voor elke waarneming en tel dit bij elkaar op. Daarna delen door (aantal waarnemingen - aantal variabelen)
39
Ordinary Least Squares methode
Methode om de regressielijn te tekenen; | Hierbij worden de residuen zo ver mogelijk geminimaliseerd, om de foutmarge zo klein mogelijk te maken.
40
Formule ordinary least squares methode
(geobserveerde waarde - schatting)^2, voor ieder individu bij elkaar optellen. Hoe kleiner deze waarde, hoe minder residuen er zijn en dus hoe nauwkeuriger de lijn getekend kan worden.
41
r2
proportie verklaarde variantie bij enkelvoudige variantie | variantie voorspelde waarden van Y : variantie waargenomen waarden van Y
42
F waarde berekenen
GKS tussen : GKS binnen of GKS regressie : GKS residu
43
Uitvoering F toets voor het gehele model
H0: β1 = 0 Ha: β1 ≠ 0 GKS binnen : GKS residu n-p-1
44
Lineariteit
er moet een lineair verband zijn tussen X en Y
45
Homoskedasticiteit
Er is een constante variantie van de residuen. De spreiding rondom het gemiddelde moet bij iedere x ongeveer gelijk zijn.
46
Normaliteit
Normale verdeling van de residuen
47
Gestandaardiseerde coëfficiënt berekenen
coëfficiënt x standaardafwijking Xn : standaardafwijking Y
48
Multicollineariteit
Sterke lineaire samenhang tussen twee of meer X-variabelen. Gevolg; se wordt te groot
49
Gevolg multicollineariteit
Omdat se te groot wordt, daalt de waarde van de toetsingsgrootheid, waardoor Bj = 0 minder snel verworpen wordt, waardoor je minder snel een significant verband vindt
50
Hoe is multicollineariteit te achterhalen?
- t waarden gepaard bij hoge F waarden - Hoge correlaties tussen X variabelen - Grote veranderingen in coëfficiënten treden op bij verwijdering van een x variabele uit het model
51
Hoe is multicollineariteit op te lossen?
- Niets doen; is alleen een probleem als de samenhang groter is dan de R2 van het regressiemodel - Niets doen; als je niet geïnteresseerd bent in de x variabelen - Maak steekproef groter - Verwijder sterk gecorreleerde x variabelen - Voeg sterk gecorreleerde variabelen samen
52
Dummy variabelen
variabelen die de waarde 0 of 1 hebben
53
Confounder
variabele die de relatie die onderzocht wordt verstoord.
54
Mediator
verklaart de invloed van de een onafhankelijke variabele op een afhankelijke variabele
55
Moderator
beïnvloedt de relatie tussen de onafhankelijke variabele en de afhankelijke variabele
56
F toets voor groep van variabelen
((KS residu0 - KS residu1) : k): (KS residu1 :(n-p-1))
57
Wanneer F-toets voor groep van variabelen?
Wanneer het mogelijk is om een model uit te breiden met variabelen, moet gekeken worden welk model Y beter voorspelt. Een afzonderlijke F toets voor voor elk model
58
k
omvang van de groep | te vinden in nulhypothese