Statistisk inferens begreber Flashcards
Average treatment effekt
Den gennemsnitlige effekt vores treatment har på vores udfald.
ATE er sammen med selektionsbias lig forskellen i treatmentgruppens gennemsnitlige udfald og kontrolgruppens gennemsnitlige udfald.
Beskrivende statistisk
Beskriver data, ikke statistisk inferens.
Tendens-, sammenhængs- og spredningsmål Fx gennemsnit, standard afvigelse, spredning osv.
Cohens D
Et standardiseret mål for effektstørrelsen.
Tommelfingerregel(!): lille effekt: d=0,2; medium effekt: d=0,5; stor effekt: d=0,8
forskel i gennemsnit/SD
OBS: bruges kun for intervalskalerede variable.
Densityplot
grafisk fremstilling af en fordeling
Dikotome variable
Antager enten 1 eller 0 alt efter om man er i den pågældende kategori (1) eller ej (0)
Efficient
Den mest efficiente estimator er den estimator med lavest varians, da risikoen for at ramme langt fra populationsparameteret her er mindst.
Eksperimentelle data
Data fra eksperimenter, hvor treatment er tilfældigt uddelt af undersøgeren.
Ekstern validitet
Kan vores undersøgelse generaliseres til populationen? Ligner stikprøven populationen tilstrækkeligt.
Estimat
En specifik værdi, som estimaterne kan antage, udregne pba. en stikprøve.
Vores bedste bud på et populationsparameter fx populations gennemsnit.
Estimator
En regel, der benytter stikprøvedata til at beregne et bud(et estimat) på en (uobserveret populationsparameter)
fx: vi bruger en estimator for populationsgennemsnittet til at estimere populationsgennemsnittet.
Felteksperiment
Treatment tildelt uden for laboratorie eller survey
inferens
Vi bruger noget vi har set (målt og vejet) til at sige noget om noget vi ikke har set (målt og vejet).
Intern validitet
Identifikationsantagelse
Fravær af selektionsbias (parallelle trends). Bedst ved stort N, hvis randomiseringen er foretaget succesfuldt. Måler vi det vi tror vi måler eller er der måske nogle baggrunds variable, som spiller ind - altså selektionsbias.
Kan sandsynliggøres (blance-/placebo-test) og styrkes (kontrol), men ikke observeres.
Intervalskalerede variable
Rangordnede med lige langt mellem kategorierne
Fx højde, alder i år
Diskrete: Falder i enkelte punkter. Fx alder målt i hele år eller indkomst afrundet til 10.000ene
Kontinuerte: Sandsynligheden for at falde i et enkelt punkt er nærmest lig nul. Fx alder målt i dage, timer, sekunder osv. Eller indkomst.
Kausal effekt
forskellen mellem de potentielle udfald (=udfaldet i det faktiske og udfaldet i det kontrafaktiske).
I en kausalpåstand påvirker den uafhængige variabel x den afhængige variabel y.
Kausal inferens
Da kausalitet ikke kan observeres er der tale om kausal inferens (=”det at udlede et forhold, en størrelse eller et element der ikke fremgår direkte af sammenhængen”)
konfidensinterval
Et interval hvor vi kan sige at populationsgennemsnittet med en vis sikkerhed ligger inden for.
Et statistisk baseret troværdigt bud på et interval, hvorfor populationsparameret befinder sig.
Konsistent
Når stikprøve størrelsen vokser nærmer stikprøvemålene sig populationsparameterne.
Kurtosis
Siger noget om spidshed.
>3 spidsere
<3 fladere
= 3 “normal”
Laboratorie eksperiment
Treatment tildelt i laboratorie