Kvantitativ metode Flashcards

Question 1

Q

Forklar standardfejl og residual standardfejl

Answer

A

Standardfejl = Den gennemsnitlige afstand fra linjen til de observerede værdier for den givne variabel. Fortæller hvor “forkert” den gennemsnitligt gætter og bruger “the unit of measure”. En lille værdi er god, fordi værdierne således vil ligge tættere på linjen.

SE = SD/√N

Residual standardfejl = Den positive kvadratrod af den gennemsnitlige kvadrerede fejl [vi bruger det ikke, kun én gang i bilag]

Question 2

Q

Hvad er p-værdi og hvordan udregner man dem?

Answer

A

Hvis nulhypotesen er sand, hvor sandsynligt er det da at få den observerede værdi eller mere ekstremt? Dvs. forskel/afhængighed.

uddyb med udregning

Question 3

Q

Forklar, hvad f-statistik er

Answer

A

F-testen dækker over den samlede test-værdi i regressioner.

Nul-hypotesen er, at alle beta-koefficienter er = 0 og at modellen således ingen kraft har til at forudse værdier.

Derfor vil den også typisk være signifikant.

Question 4

Q

Forklar, hvordan adjusted R^2 og R^2 udregnes

Answer

A

R2 = Hvor mange færre fejl laver vi, når vi anvender regressionslinjen fremfor at gætte på gennemsnittet? Goodness-of-fit (hvor akkurat modellen er) for lineære modeller. Den identificerer procenten af variansen i den afhængige variabel som kan forklare af variansen i de uafhængige variable.

Adj. R2 = Ligesom R2, men dette mål “straffer” for indførslen af ubruglige variable. Hvis man tilføjer ubrugelige variable, vil værdien formindskes. Hvis man tilføjer gode variable, vil den stige. Vil altid være mindre end eller lig med R2.

Question 5

Q

Hvad er ESS

Answer

A

Difference i “error sum of squares (SSE)” for to modeller - altså ser den på den marginale reduktion i SSE når nye uafhængige variable tilføjes. Hvis 0 = er modellerne identiske.

Question 6

Q

Hvad er Levene’s

Answer

A

Test for varians i to eller flere grupper.

Nulhypotesen er, at variansen i grupperne er ens (homoskedasticitet). Hvis p-værdien er under 0,05, er det usandsynligt, at insamlingen har været tilfældig.

Question 7

Q

Hvad er forudsætninger i OLS og SEM

Answer

A

1) Linearitet
2) Fravær af outliers/ekstreme cases
3) Normalfordelte fejlled (konstant spredning) [kun problem ved n < 100 ]
4) Varianshomogenitet (varians af fejlled skal være ens for værdier af x, dvs det må ikke stige med x)
5) Fravær af multikollinearitet

Question 8

Q

Hvad er antagelser i OLS og SEM

Answer

A

1) Tilfældigt sample
2) Normalfordeling
3) Fravær af multikollinearitet

Question 9

Q

Hvorfor bruger i SEM?

Answer

A

I vores speciale har vi opstillet en række medierende og interagerende hypoteser, som på mange måder teoretisk spiller sammen - og det er også den “teoretiske arv” fra Bourdieu, at teoretiske begreber og fænomener ikke kan anskues isoleret fra hinanden.

Vi kan se nogle variable som både uafhængige og afhængige.

Question 10

Q

Hvad bruger man målene CFI, RMSEA og SRMR til i SEM, og hvorfor inddrager I jeres SEM’er, selvom de ikke overholder alle kriterierne?rms

Answer

A

Målene bruges til at se, om ens SEM har et godt “model fit”, altså at modellen opsummerer de faktiske sammenhænge mellem variablene i dataet. Det er lidt SEM’s “pendant” til R^2 i OLS. Hvor man i OLS vil øge forklaringen af variansen i y, er ønsket i SEM at lave den bedst mulige teoretiske approksimation af dataet. Hvis modellens fit ikke overholder målene kan det betyde, at ens teoretiske antagelser om variablenes samspil ikke holder stik.

Vores model fit er højst sandsynlige dårlige, fordi vi har inddraget alle kontrolvariable i alle regressionsled. Det gør nemlig modellen mere kompleks, og målene “straffer”, hvis den ikke kan se, at der er en sammenhæng mellem hver en kontrolvariabel og en endogen/eksogen variabel. Fx hvis merit-dummy ikke har en effekt på mestringstro, osv. Vi kan se, at fittet bliver bedre, når vi fjerner nogle af kontrollerne.

Det skyldes derfor til dels at vi har tilstræbt at gøre dem som sammenlignelige med OLS som muligt.

Question 11

Q

Hvad præcis viser en mediation i jeres SEM?

Answer

A

En mediation er et andet ord for en indirekte effekt. Fx kan vi se i flere af vores SEM, at en variabel (fx køn eller intrinsisk motivation) korrelerer med højere stressniveau og at højere stressniveau korrelerer med præstation. Dette er en mediationseffekt, idet stressniveau medierer en effekt af køn/IM på præstation. Mediation kan enten være partial (variablen medierer en del af sammenhængen) eller fuld (variablen medierer hele sammenhængen).

Question 12

Q

Hvad viser faktor loadings’ne i jeres SEM og hvad bruger I dem til?

Answer

A

Korrelationen mellem indikator-variablen og det latente begreber.

Uddyb?

Question 13

Q

Hvorfor har vi ikke standardiserede vores variable?

Answer

A

1) Vi bruger virkelig mange dummies, som ikke kan standardiseres.
2) Når vi ikke standardiserer, kan vi fortolke beta koefficienter i de oprindelig måleenheder, som for vores analyse giver ret god mening

Question 14

Q

Hvad er co-varians?

Answer

A

Afhængigheden mellem to variable x og y. Hvis der er total uafhængig er Cov(x, y) = 0.

Cov(x) = Gnst((x-Ex)*(y-Euy)), hvor Ex er gnst. for x og eY er gnst .for y.

Question 15

Q

Hvorfor giver det mening BÅDE at bruge SEM og OLS?

Question 16

Q

Forklar de grundlæggende forskelle på jeres brug af SEM og OLS

Answer

Study These Flashcards

A

I OLS har vi én afhængig variabel ad gangen. Vi kan få øje på både direkte men også indirekte effekter, således at de kausale relationer mellem variable bliver mere tydelige.

I SEM kan vi have flere afhængige variable. SEM bruges til at teste teoretiske hypoteser, så vi ville ikke kunne gøre det, hvis vi slet ikke havde en idé om at der var en sammenhæng.

Question 17

Q

Hvorfor viser I ikke fejlleddene på SEM, og hvis I havde gjort det, hvad ville det så vise?

Answer

Study These Flashcards

A

Fejlleddene viser usikkerheden for hvert regressionsled. Ligesom i regressions er det et formidlingsmæssigt valg. I bilag kigger vi på de standardiserede målefejl for at se om nogle variable under- eller overforklares i modellerne. Men det har ikke været et analysefokus i opgaven.

Question 18

Q

Hvorfor viser I ikke standardfejl i regression, og hvis I havde gjort det, hvad ville det så vise.

Answer

Study These Flashcards

A

Vi viser ikke standardfejl, fordi det kan være lidt forvirrende i tabellerne - det er et formidlingsmæssigt valg. Det ville vise usikkerheden for den enkelte regressionslinje. Imidlertid reflekterer p-værdier også standardfejlen.

Question 19

Q

Er det trivsel eller stress? Hvad viser I helt præcist?

Answer

Study These Flashcards

A

Nogle steder står der trivsel i figurbeskrivelser - og trivsel er også stærkt korreleret med stress, som det fremgår i litteraturen. Men det er stress-niveau.

Question 20

Q

Hvad er type I og type II fejl?

Answer

Study These Flashcards

A

Type I - (falsk positiv, optimistfejl), hvis man afviser en nulhypotese som faktisk er sand. Fx hvis man siger, at der ER en forskel i præstation pba. bedømmelsesform, når der “i virkeligheden” ikke er det.

–> Kilder: Mangel på kontolvariable

Type II - (falsk negativ, pessimistfejl), hvis man afviser en nulhypotese som faktisk er falsk. Fx hvis man siger der IKKE er en forskel i præstation pba. bedømmelsesform, når der “i virkeligheden” er det.

–> Kilder: For lavt n, for store standardfejl.

Question 21

Q

Hvad er fejlledet ε

Answer

Study These Flashcards

A

Afstand fra linjen til punktet. Random.

Question 22

Q

Hvad er cronbach’s alpha?

Answer

Study These Flashcards

A

Mål for intern konsistens i indeks/latente variable.

Question 23

Q

Hvad er knn og mean imputation?

Answer

Study These Flashcards

A

knn = k nearest neighbours imputation. Tager de k nærmeste naboer og tager gennemsnittet af deres værdier for at få en imputeret værdi

mean = imputerer blot gennemsnittet.

Kvantitativ metode Flashcards

(23 cards)