Paneldata Flashcards

1
Q

Hva er hhv.

  • Tverrsnittsdata?
  • Tidsseriedata?
  • Paneldata?
A

Tverrsnittsdata er datasett med ulike tverrsnittsenheter. Variablene i et tverrsnitts data er enten observert på ett bestemt tidspunkt, eller gjennomsnitt over lengre tidsperioder.

Tidsseriedata: en tverrsnittsenhet som er målt på ulike tidspunkter.

Paneldata: Kombinerer forskjellige tversnittsenheter med forskjellige tverrsnittsdata på ulike tider. Hver variabel målt for hvert enkelt tidspunkt. Undersøkelsesenhetene vil derfor være per år.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Holder OLS-forutsetningene i longitudinelle studier?

A

I longitudinelle studier er ikke OLS lenger BLUE. Fordi det vil underestimere usikkerheten (restleddene). Svært ofte vil forutsetningen om ukorrelerte restledd ikke være oppfylt -> autokorrelasjon. Restleddet indikerer differansen mellom predikert og observert Y. Restleddet er ofte en tidskontinuerlig variabel, altså: om den er positiv ett år, så vil den være positiv neste år også.

Utelatte variabler vil også mest sannsynlig være tilstede ved andre tidspunkter. Mest vanlig med positiv autokorrelasjon. OLS-estimatene vil være forventingsrette men ikke effisiente -> galt estimat på usikkerhet. Kan føre til feilslutninger i signifikanstesting. Den vanligste måten å modulere autokorrelasjon på er AR(1) prosessen. Durbin-Watson test: varierer mellom 0 (r=1) og 4 (r=-1). d = 0 positiv autokorrelasjon. d = 2 = ingen autokorrelasjon. d = 4 = negativ autokorrelasjon. Ikke uavhengig data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Gjør rede for hhv.

  • Tidstrend/dummy
  • Lagging
  • Differensiering
A

Dette er metoder for å løse autokorrelasjon:

Tidstrend/dummy: fanger opp tidsfasteeffekter. Sjokk. F.eks. en veldig karismatisk leder. Tidsdummy med 4-årsperiode vil fange opp at det er høyere verdier og løfte den predikerte stemmeveriden og synke residualene.

Lagget: ofte AV. Bør UV måles før AV, isåfall hvor lenge før? Korrelasjon mellom ulike tidspunkter, hva som korrelerer mest. Robusthet. Mister opplysninger. F.eks. AV målt i t, og UV målt i t-x, der x er lag-lengde. Om vi vil se på utdanning på demokrati, så kan vi si t-5, vi ser på demokrati 5 år før utdanning. Demokrati i 1990, og utdanning i 1995.

Differensiering: Opprette en ny tidsserie og en første ordens lagg mellom tidsperiodene xt og xt-1 som ny variabel. Den laggete utgaven er forskjøvet med en eller flere tidsenheter. Ligner veldig på lagging.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Gjør rede for restleddsforutsetninger i paneldata.

A

Restleddene kan også være korrelerte på tvers av paneler i samme tidsperiode.
–> “contemporaneous correlation”

Panelspesifikk heteroskedasitet: restleddene har ulik varians for ulike tversnittsenheter. OLS ikke lenger BLUE. Løsning: OLS PCSE.
–> OLS med panelkorrigerte standardsfeil (PCSE), ulike varianter. Simulerer datasett, og kjører ulike teknikker for å si noe om hva som best forklarer sammenheng. Hvilke teknikker som under- eller overestimerer usikkerhet. Koeffisientene tolkes som vanlig OLS.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er fixed-effektanalyse?

A

Fixed-effektanalyse kontrollerer for utelatt variabelskjevhet. Altså, variabler som varierer mellom respondenter, men som er konstante for hver respondent over tid. Kan inkludere dummyvariabel for tversnittsfaste-, tidsfasteeffekter eller begge (oftest tverr, landsfaste effekter). Ofte sannsynlig at karakteristikker ved f.eks. land som vi ikke klarer å identifisere eller måle. Påvirker x og y –> kultur, politisk historie, ideologi. Mindre bias men kan få store standardfeil.

Tidsfasteeffekter.
Brå sjokk i UV i en bestemt periode, kriger, valg.
Trender i AV: teknologi, økonomi, estimerer en dummy, estimerer effekter som plukker opp trender.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly