Statistik 1 Flashcards
Deskriptiv statistik
Beskriver variablerna som mäts i ens stickprov.
Sammanfattande värden.
Grafisk redovisning.
Inferentiell statistik
Försöker använda stickprovet för att dra slutsatser om populationen.
Statistiska test, ex p-värden, konfidensintervall.
Population
Alla möjliga “deltagare” av det vi är intresserade av.
Stickprov
De deltagare vi faktiskt observerar och gör mätningar på
Parameter
Ett “sant” värde i populationen.
Tex det egentliga medelvärdet för hela populationen.
Estimat
Värdet vi observerar i stickprovet.
Tex medelvärdet för stickprovet
Variabel
Något vi mäter i vårt stickprov, ex kön, längd, ålder, etc
Nominalskala
Gruppera variabler
Ordinalskala
Nominal+ rangordning, ex guld, silver, brons
Intervallskala
ordinal+ jämna skalsteg, ex celsius
Kvotskala
intervallskala+ absolut nollpunkt, ex kelvin, måttband
Centralmått
Mäter det övergripande “läget” för en variabel
Typvärde
Det vanligaste förekommande värdet
Median
Det mittersta värdet efter man rangordnat alla värden
Medelvärde
Det genomsnittliga värdet.
Alla värden summerade, sedan delade på antal värden.
Spridningsmått
Mäter hur utspridda värderna på en variabel är.
Variationsbredd
Skillnaden mellan högsta och lägsta värdet.
Percentiler och Kvartiler
Hur många procent/kvartiler av värderna som ligger under det värdet
Standardavvikelse och varians
mått på genomsnittlig variation
Stickprovs-standardavvikelse
Roten ur summa av kvadraten av alla avvikelser från medelvärdet delat med antalet observationer minus 1
Varians
detsamma som stickprovs standardavvikelse men upphöjt till 2
Populations-standaravavvikelse
Betecknas med sigma istället för s
z-värde
Hur många standardavvikelser från medelvärdet som en observation är
Barplot
antalet observationer för varje värde på en begränsad kategorisk variabel.
Mellanrum mellan staplarna.
Kategorisk variabel
kan bara anta ett visst (ofta litet) antal värden, tex 0, 1, 2, osv
Histogram
antalet observationer i olika spann av värden för en (mer) kontinuerlig variabel.
Kontinuerlig variabel
en variabel vars värden kan anta alla värden inom något spann
Boxplot (lådagram)
median och kvartiler/percentiler
Scatterplot
värden på två variabler samtidigt, bra för att se samband
Korrelation
Ett mått på samvariation
Pearsons r
mäter styrkan på linjära samband mellan variabler
Spearmans rho
Baseras på observationernas rangordning
Regression
Används för att predicera värdet på en variabel y utifrån värdet på en annan variabel x
Linjär regressions analys
y=b0+b1X (som linjära ekvationen y= m+ kx