Kvantitativ metode Flashcards
Forklar standardfejl og residual standardfejl
Standardfejl = Den gennemsnitlige afstand fra linjen til de observerede værdier for den givne variabel. Fortæller hvor “forkert” den gennemsnitligt gætter og bruger “the unit of measure”. En lille værdi er god, fordi værdierne således vil ligge tættere på linjen.
SE = SD/√N
Residual standardfejl = Den positive kvadratrod af den gennemsnitlige kvadrerede fejl [vi bruger det ikke, kun én gang i bilag]
Hvad er p-værdi og hvordan udregner man dem?
Hvis nulhypotesen er sand, hvor sandsynligt er det da at få den observerede værdi eller mere ekstremt? Dvs. forskel/afhængighed.
uddyb med udregning
Forklar, hvad f-statistik er
F-testen dækker over den samlede test-værdi i regressioner.
Nul-hypotesen er, at alle beta-koefficienter er = 0 og at modellen således ingen kraft har til at forudse værdier.
Derfor vil den også typisk være signifikant.
Forklar, hvordan adjusted R^2 og R^2 udregnes
R2 = Hvor mange færre fejl laver vi, når vi anvender regressionslinjen fremfor at gætte på gennemsnittet? Goodness-of-fit (hvor akkurat modellen er) for lineære modeller. Den identificerer procenten af variansen i den afhængige variabel som kan forklare af variansen i de uafhængige variable.
Adj. R2 = Ligesom R2, men dette mål “straffer” for indførslen af ubruglige variable. Hvis man tilføjer ubrugelige variable, vil værdien formindskes. Hvis man tilføjer gode variable, vil den stige. Vil altid være mindre end eller lig med R2.
Hvad er ESS
Difference i “error sum of squares (SSE)” for to modeller - altså ser den på den marginale reduktion i SSE når nye uafhængige variable tilføjes. Hvis 0 = er modellerne identiske.
Hvad er Levene’s
Test for varians i to eller flere grupper.
Nulhypotesen er, at variansen i grupperne er ens (homoskedasticitet). Hvis p-værdien er under 0,05, er det usandsynligt, at insamlingen har været tilfældig.
Hvad er forudsætninger i OLS og SEM
1) Linearitet
2) Fravær af outliers/ekstreme cases
3) Normalfordelte fejlled (konstant spredning) [kun problem ved n < 100 ]
4) Varianshomogenitet (varians af fejlled skal være ens for værdier af x, dvs det må ikke stige med x)
5) Fravær af multikollinearitet
Hvad er antagelser i OLS og SEM
1) Tilfældigt sample
2) Normalfordeling
3) Fravær af multikollinearitet
Hvorfor bruger i SEM?
I vores speciale har vi opstillet en række medierende og interagerende hypoteser, som på mange måder teoretisk spiller sammen - og det er også den “teoretiske arv” fra Bourdieu, at teoretiske begreber og fænomener ikke kan anskues isoleret fra hinanden.
Vi kan se nogle variable som både uafhængige og afhængige.
Hvad bruger man målene CFI, RMSEA og SRMR til i SEM, og hvorfor inddrager I jeres SEM’er, selvom de ikke overholder alle kriterierne?rms
Målene bruges til at se, om ens SEM har et godt “model fit”, altså at modellen opsummerer de faktiske sammenhænge mellem variablene i dataet. Det er lidt SEM’s “pendant” til R^2 i OLS. Hvor man i OLS vil øge forklaringen af variansen i y, er ønsket i SEM at lave den bedst mulige teoretiske approksimation af dataet. Hvis modellens fit ikke overholder målene kan det betyde, at ens teoretiske antagelser om variablenes samspil ikke holder stik.
Vores model fit er højst sandsynlige dårlige, fordi vi har inddraget alle kontrolvariable i alle regressionsled. Det gør nemlig modellen mere kompleks, og målene “straffer”, hvis den ikke kan se, at der er en sammenhæng mellem hver en kontrolvariabel og en endogen/eksogen variabel. Fx hvis merit-dummy ikke har en effekt på mestringstro, osv. Vi kan se, at fittet bliver bedre, når vi fjerner nogle af kontrollerne.
Det skyldes derfor til dels at vi har tilstræbt at gøre dem som sammenlignelige med OLS som muligt.
Hvad præcis viser en mediation i jeres SEM?
En mediation er et andet ord for en indirekte effekt. Fx kan vi se i flere af vores SEM, at en variabel (fx køn eller intrinsisk motivation) korrelerer med højere stressniveau og at højere stressniveau korrelerer med præstation. Dette er en mediationseffekt, idet stressniveau medierer en effekt af køn/IM på præstation. Mediation kan enten være partial (variablen medierer en del af sammenhængen) eller fuld (variablen medierer hele sammenhængen).
Hvad viser faktor loadings’ne i jeres SEM og hvad bruger I dem til?
Korrelationen mellem indikator-variablen og det latente begreber.
Uddyb?
Hvorfor har vi ikke standardiserede vores variable?
1) Vi bruger virkelig mange dummies, som ikke kan standardiseres.
2) Når vi ikke standardiserer, kan vi fortolke beta koefficienter i de oprindelig måleenheder, som for vores analyse giver ret god mening
Hvad er co-varians?
Afhængigheden mellem to variable x og y. Hvis der er total uafhængig er Cov(x, y) = 0.
Cov(x) = Gnst((x-Ex)*(y-Euy)), hvor Ex er gnst. for x og eY er gnst .for y.
Hvorfor giver det mening BÅDE at bruge SEM og OLS?
Uddyb