Statistisk inferens pointer Flashcards
Ugernes væsentligste spørgsmål
Hvordan kan vi bruge statistik til at besvare politologiske spørgsmål?
- Mange politologiske spørgsmål er kvantitative, da der arbejdes med kvantitativt materiale og kvantitative svar. Dertil er mange politologiske spørgsmål kausale. Her er statistik også ofte brugbart, da man arbejder med store datasæt.
- Når man arbejder med kvantitativt materiale med en stor mængde observationer er det mere generaliserbart, men for at overskue det bruges statistik.
Hvad er kausalitet og effekt?
Kausalitet er en årsagssammenhænge, hvor en uafhængigvariabel (x) har en effekt på (påvirker) en afhængig variabel (Y).
Den kausale effekt er forskellen i potentielle udfald dvs. udfaldet i situationer med det faktiske (x) og det kontrafaktiske (ikke-x).
Det er dog ikke muligt både at observere x og ikke-x samtidigt for et individ, derfor observeres ofte grupper, som gerne skal ligne hinanden for at mindske selektionsbias og dermed øge den interne validitet.
Hvad betyder begrebet potentielle udfald?
Potentielle udfald er mulige udfald. I et eksperiment med en treatment og en kontrolgruppe vil der være to mulige udfald alt efter om man får eller ikke-får treatment. Disse skrives ofte som Y_0i og Y_1i hvor Y er udfald, i er individet og 0/1 afgører om der er treatment eller ej.
Hvad er det fundamentale problem ved kausal inferens?
Inferens betyder tankegang eller slutning. Det fundamentale problem med kausal inferens er, at man ikke kan observere kausalitet, da man ikke både kan have det faktiske og kontrafaktiske samtidigt. Man kan derfor kun observere et af de potentielle udfald for hver enhed.
Hvad er intern validitet?
Internvaliditet er afgørende for studiets troværdighed. Hvis den interne validitet er høj vil det sige at troværdigheden er høj inden for selve studiet dvs. at vi måler det vi gerne vil. Hvis omfanget af selektion er stort mindsker det den interne validitet.
Hvad betyder begreberne selektion, selektionsbias og balance?
- Selektion betyder udvælgelse og henviser til hvordan der i eksperimenter og observationer af grupper er systematiske forskelle i grupperne.
- Selektionsbias opstår når der er forskel i de grupper man observere. Hvis gruppernes forventede udfald er forskelligt fra hinanden når ingen af grupperne får treatment er det selektionsbias.
- Balance er målet når man udvælger grupper. Man kan afgøre balancen ved at sammenligne nogen af de bagvedliggende variable fx køn, alder, uddannelse.
Hvad er varians, skævhed og kurtosis, og hvad kan det bruges til?
- Varians: gennemsnitlig kvadrerede afvigelse fra gennemsnittet. Bruges til at fortælle hvor meget observationer variere fra gennemsnittet. Sum-kommandoen i STATA. Jo højere variansen er jo større vil spredningen fra gennemsnittet være og jo fladere vil fordelingen være rent grafisk.
- Skævhed: I hvilken grad er grafen forskudt højre/venstre. Handler om hvordan variationen fordeler sig omkring gennemsnittet.
<0 venstreskæv
>0 højreskæv
=0 symmetrisk (klokkeformet) - Kurtosis: Spidshedsmål. Hvor meget data er koncentreret omkring gennemsnittet og hvor “spidse” /”flade” halerne af fordelingen er. Mere masse i halen = større sandsynlighed for outliers.
>3 spidsere
<3 fladere
= 3 “normal”
Hvad er et densityplot?
en grafisk fremstilling af en sandsynlighedsfordeling. Skal gerne give 1.
Viser en kontinuert skønnelse af sandsynlighedstætheden for variablen.”
Hvad er forskellen på observationelle og eksperimentelle data?
Ved eksperimentiellet data har man manipuleret med virkeligheden. Forskeren har altså bestem fordelingen af treatment som dermed er kunststig.
Ved oberservationel data er treatment uddelt uafhængigt af forskeren.
Hvad kendetegner eksperimentelle forskningsdesigns?
Tilfældig udvælgelse af treatment og kontrolgruppe, hvilket fjerner selektionsbias.
Treatment tildelt tilfældigt, hvilket gør treatment uafhængigt af potentielle udfald.
Hvorfor er eksperimentelle forskningsdesigns generelt gode til at afdække kausaleffekter?
Ved tilfældig udvælgelse kan man minimere selektionsbias. Man kan, hvis kontrolgruppe og treatmentgruppe er succesfuldt udvalgt så de er i balance og har samme potentielle udfald, teste effekten af treatment som forskel i udfald.
Hvad er en stokastisk variabel?
En variabel bestemt med et element af tilfældighed, men det er muligt at beregne og analysere usikkerheden ved denne tilfældighed.
Hvad er en sandsynlighedsfordeling?
En sandsynlighedsfordeling er en beskrivelse af de mulige værdier en stokastisk variabel kan tage.
Ofte ses disse i tabel form eller grafisk som et søjle diagram over sandsynligheds fordelingen for diskrete stokastiske variable eller et densitets graf for kontinuerte stokastiske variable.
Hvad er forskellen på normal- og t-fordelingen?
Z-fordelingen også kaldt normalfordelingen er unik, der er en fordeling og vi kender fordelingen helt nøje.
T-fordelingerne er også en sandsynlighedsfordeling, men afhænger af hvor stor vores stikprøve er. t-fordelingen har tykkere haler end z-fordelingen ved lavt n.
Når n er høj er t- og z- fordelingen ens.
Hvad betyder simpel tilfældig udtrækning?
når man tilfældigt udvælger en stikprøve fra en population.Pointen med en tilfældig udvælgelse er at sikre, at stikprøven er repræsentativ for populationen.