Kvantitativ metode Flashcards

1
Q

Forklar standardfejl og residual standardfejl

A

Standardfejl = Den gennemsnitlige afstand fra linjen til de observerede værdier for den givne variabel. Fortæller hvor “forkert” den gennemsnitligt gætter og bruger “the unit of measure”. En lille værdi er god, fordi værdierne således vil ligge tættere på linjen.

SE = SD/√N

Residual standardfejl = Den positive kvadratrod af den gennemsnitlige kvadrerede fejl [vi bruger det ikke, kun én gang i bilag]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er p-værdi og hvordan udregner man dem?

A

Hvis nulhypotesen er sand, hvor sandsynligt er det da at få den observerede værdi eller mere ekstremt? Dvs. forskel/afhængighed.

uddyb med udregning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Forklar, hvad f-statistik er

A

F-testen dækker over den samlede test-værdi i regressioner.

Nul-hypotesen er, at alle beta-koefficienter er = 0 og at modellen således ingen kraft har til at forudse værdier.

Derfor vil den også typisk være signifikant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Forklar, hvordan adjusted R^2 og R^2 udregnes

A

R2 = Hvor mange færre fejl laver vi, når vi anvender regressionslinjen fremfor at gætte på gennemsnittet? Goodness-of-fit (hvor akkurat modellen er) for lineære modeller. Den identificerer procenten af variansen i den afhængige variabel som kan forklare af variansen i de uafhængige variable.

Adj. R2 = Ligesom R2, men dette mål “straffer” for indførslen af ubruglige variable. Hvis man tilføjer ubrugelige variable, vil værdien formindskes. Hvis man tilføjer gode variable, vil den stige. Vil altid være mindre end eller lig med R2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er ESS

A

Difference i “error sum of squares (SSE)” for to modeller - altså ser den på den marginale reduktion i SSE når nye uafhængige variable tilføjes. Hvis 0 = er modellerne identiske.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er Levene’s

A

Test for varians i to eller flere grupper.

Nulhypotesen er, at variansen i grupperne er ens (homoskedasticitet). Hvis p-værdien er under 0,05, er det usandsynligt, at insamlingen har været tilfældig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er forudsætninger i OLS og SEM

A

1) Linearitet
2) Fravær af outliers/ekstreme cases
3) Normalfordelte fejlled (konstant spredning) [kun problem ved n < 100 ]
4) Varianshomogenitet (varians af fejlled skal være ens for værdier af x, dvs det må ikke stige med x)
5) Fravær af multikollinearitet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er antagelser i OLS og SEM

A

1) Tilfældigt sample
2) Normalfordeling
3) Fravær af multikollinearitet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvorfor bruger i SEM?

A

I vores speciale har vi opstillet en række medierende og interagerende hypoteser, som på mange måder teoretisk spiller sammen - og det er også den “teoretiske arv” fra Bourdieu, at teoretiske begreber og fænomener ikke kan anskues isoleret fra hinanden.

Vi kan se nogle variable som både uafhængige og afhængige.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad bruger man målene CFI, RMSEA og SRMR til i SEM, og hvorfor inddrager I jeres SEM’er, selvom de ikke overholder alle kriterierne?rms

A

Målene bruges til at se, om ens SEM har et godt “model fit”, altså at modellen opsummerer de faktiske sammenhænge mellem variablene i dataet. Det er lidt SEM’s “pendant” til R^2 i OLS. Hvor man i OLS vil øge forklaringen af variansen i y, er ønsket i SEM at lave den bedst mulige teoretiske approksimation af dataet. Hvis modellens fit ikke overholder målene kan det betyde, at ens teoretiske antagelser om variablenes samspil ikke holder stik.

Vores model fit er højst sandsynlige dårlige, fordi vi har inddraget alle kontrolvariable i alle regressionsled. Det gør nemlig modellen mere kompleks, og målene “straffer”, hvis den ikke kan se, at der er en sammenhæng mellem hver en kontrolvariabel og en endogen/eksogen variabel. Fx hvis merit-dummy ikke har en effekt på mestringstro, osv. Vi kan se, at fittet bliver bedre, når vi fjerner nogle af kontrollerne.

Det skyldes derfor til dels at vi har tilstræbt at gøre dem som sammenlignelige med OLS som muligt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad præcis viser en mediation i jeres SEM?

A

En mediation er et andet ord for en indirekte effekt. Fx kan vi se i flere af vores SEM, at en variabel (fx køn eller intrinsisk motivation) korrelerer med højere stressniveau og at højere stressniveau korrelerer med præstation. Dette er en mediationseffekt, idet stressniveau medierer en effekt af køn/IM på præstation. Mediation kan enten være partial (variablen medierer en del af sammenhængen) eller fuld (variablen medierer hele sammenhængen).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad viser faktor loadings’ne i jeres SEM og hvad bruger I dem til?

A

Korrelationen mellem indikator-variablen og det latente begreber.

Uddyb?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvorfor har vi ikke standardiserede vores variable?

A

1) Vi bruger virkelig mange dummies, som ikke kan standardiseres.
2) Når vi ikke standardiserer, kan vi fortolke beta koefficienter i de oprindelig måleenheder, som for vores analyse giver ret god mening

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er co-varians?

A

Afhængigheden mellem to variable x og y. Hvis der er total uafhængig er Cov(x, y) = 0.

Cov(x) = Gnst((x-Ex)*(y-Euy)), hvor Ex er gnst. for x og eY er gnst .for y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvorfor giver det mening BÅDE at bruge SEM og OLS?

A

Uddyb

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Forklar de grundlæggende forskelle på jeres brug af SEM og OLS

A

I OLS har vi én afhængig variabel ad gangen. Vi kan få øje på både direkte men også indirekte effekter, således at de kausale relationer mellem variable bliver mere tydelige.

I SEM kan vi have flere afhængige variable. SEM bruges til at teste teoretiske hypoteser, så vi ville ikke kunne gøre det, hvis vi slet ikke havde en idé om at der var en sammenhæng.

17
Q

Hvorfor viser I ikke fejlleddene på SEM, og hvis I havde gjort det, hvad ville det så vise?

A

Fejlleddene viser usikkerheden for hvert regressionsled. Ligesom i regressions er det et formidlingsmæssigt valg. I bilag kigger vi på de standardiserede målefejl for at se om nogle variable under- eller overforklares i modellerne. Men det har ikke været et analysefokus i opgaven.

18
Q

Hvorfor viser I ikke standardfejl i regression, og hvis I havde gjort det, hvad ville det så vise.

A

Vi viser ikke standardfejl, fordi det kan være lidt forvirrende i tabellerne - det er et formidlingsmæssigt valg. Det ville vise usikkerheden for den enkelte regressionslinje. Imidlertid reflekterer p-værdier også standardfejlen.

19
Q

Er det trivsel eller stress? Hvad viser I helt præcist?

A

Nogle steder står der trivsel i figurbeskrivelser - og trivsel er også stærkt korreleret med stress, som det fremgår i litteraturen. Men det er stress-niveau.

20
Q

Hvad er type I og type II fejl?

A

Type I - (falsk positiv, optimistfejl), hvis man afviser en nulhypotese som faktisk er sand. Fx hvis man siger, at der ER en forskel i præstation pba. bedømmelsesform, når der “i virkeligheden” ikke er det.

–> Kilder: Mangel på kontolvariable

Type II - (falsk negativ, pessimistfejl), hvis man afviser en nulhypotese som faktisk er falsk. Fx hvis man siger der IKKE er en forskel i præstation pba. bedømmelsesform, når der “i virkeligheden” er det.

–> Kilder: For lavt n, for store standardfejl.

21
Q

Hvad er fejlledet ε

A

Afstand fra linjen til punktet. Random.

22
Q

Hvad er cronbach’s alpha?

A

Mål for intern konsistens i indeks/latente variable.

23
Q

Hvad er knn og mean imputation?

A

knn = k nearest neighbours imputation. Tager de k nærmeste naboer og tager gennemsnittet af deres værdier for at få en imputeret værdi

mean = imputerer blot gennemsnittet.