Introduktion til statistik (lektion 1-5) Flashcards
Def. på en variabel
Alt der kan måles, og som kan variere på tværs af tid eller anden ´unit´
Kategorisk data
Opdeles i nominal data og ordinal data
Kontinuert data
Opdeles i ratio og interval
Nominal data
Data har ingen naturlig orden eller numerisk værdi, som kan sammenlignes. (fx. køn, etnicitet, farver osv.) Kaldes binær når der er to.
Ordinal data
Der er en logisk rækkefølge i kategorierne, men forskellen mellem kategorierne kan ikke betegnes som nøjagtig lige stor (fx. tøj-størrelser, plads i et løb, osv.)
Ratio data
Data har et naturlig nul, forskel mellem tal er sammenlignelig (fx. alder, hastighed, højde, osv.)
Interval data
Data har ikke et naturligt nul, forskel mellem tal er sammenlignelig (fx. temperatur, dato osv.)
Validitet
Måler man det som man har intention om at måle?
Finder man frem til IQ ved at måle længden af individet tæer, eller gør man det med en IQ-test?
Reliabilitet
Vil metoden producere de samme resultater, hvis man udførte målingen igen under samme betingelser?
De fire former for random-sampling
Simple random sampling
systematic random sampling
Stratified sampling
Cluster sample
De fire former for non-random sample
Quota sampling
Oppertunity/convenience sampling
Snowball sampling
Case studies
Simple random sampling
Alle data har lige stor sandsynlighed for at blive valgt og medtaget i studiet.
systematic random sampling
fx. når hver 10. person vælges tilsat være med i studiet. Dvs. både tilfældigt/random, men stadig i system.
Stratified sampling
Når man tilrettelægger en sample procentsatser i en population. fx. hvis populationen er 10% jurastuderende, så skal ens sample også indeholde 10% jurastuderende.
Cluster sample
Når en særlig gruppe af individer udvælges random, fx. en skoleklasse eller forening.
Korrelationel research
Når man observere det som naturligt forekommer unden at intervenere.
Eksperimentel research
Når man manipulere med en variabel og observere effekten på den anden variabel.
Usystematisk variation
Variation som opstår på baggrund af ukendte grunde, tilfældig variation (noise) eller konfunderende variable
Systematisk variation
Variation som opstår på baggrund af manipulation med en variabel.
Formålet med deskriptiv statistik
At sammenfatte, organisere og simplificere data
Hvordan er normalfordeling formet i et histogram?
klokkeformet
De to former for skew/skævhed
positively skew og negatively skew
Positively skewed
Mange observationer i den lave ende
huskeregel: Hvis der i et histogram over karakterer er mange lave karakterer, er man positively screwed
Negatively skewed
Mange observationer i den høje ende.
Hvad beskriver kurtosis
Beskriver om observationerne hovedsageligt befinder sig i mod midten af histogrammet, dvs. få meget høje søjler i midten, eller om observationer er mere bredt fordelt udover hele histogrammet.
Leptokurtic kurtosis
Observationerne befinder sig hovedsageligt i midten af histogrammet, dvs. høj tynd form.
Platykurtic kurtosis
Observationerne befinder sig bredt ud over hele histogrammet mod halerne, dvs. flad fordeling.
Outliers
Ekstreme observationer, som befinder sig helt ude i halerne. Kan være fejl i målingen eller genuine observationer. Outliers forstyrrer målingen af spredningen
Mode
Den scorer som forekommer flest gange
Mean
Den gennemsnitlige score
Median
Den midterste score