Statistik Flashcards
Parameter
Värde som beskriver populationen
Estimat
Värde som vi mätt eller beräknat från stickprovet
Typvärde
Det vanligaste värdet
Median
Det mittersta värdet
Medelvärde
Det genomsnittliga värdet. Väntevärdesriktigt!
Väntevärdesriktigt
Stickprovsmedelvärdet förväntas motsvara populationsmedelvärdet i det långa loppet
Variationsbredd
Skillnaden mellan det högsta och lägsta värdet
Percentiler & Kvartiler
Värde under vilket en viss andel av fördelningen ligger
Varians & Standardavvikelse
Genomsnittlig variation
Normalfördelningen
Beskrivning av hur data är fördelad. Standardavvikelserna sammanfaller med vissa specifika percentiler
Z-värden
Sätt att skriva om data så att varje värde beskriver hur många standardavvikelser det är från medelvärdet. Standardisering av data, förenklar att jämföra variabler med varandra
Pearsons korrelationskoefficient
Standardiserat mått på samvarians. Påvisar endast linjära korrelationer. Påverkas mycket av extremvärden. Kräver tillräcklig variation i båda variablerna
Spearmans rangkorrelationskoefficient
Baserad på observationers rangordning istället för deras z-värden. Används t.ex. när data är ordinalskala, inte normalfördelad eller vid förekomst av extremväden
Regression
Används för att förutsäga värdet av en variabel baserat på värdet av en annan. Innefattar regressionskoefficient(er) och ett intercept. Viktigt att skilja på beroende och oberoende variabel
Enkel linjär regressionsanalys
y=b0+b1x
b1 anger linjens lutning. b0 säger var linjen skär y-axeln, och kan ses som “basnivå” och b1 som ett mått på hur mycket den beroende variabeln “beror” på den oberoende variabeln