"Intro till statistik"-FW Flashcards
Deskriptiv statistik
Beskriver/sammanfattar en massa data
Inferentiell statistik
Sannolikheter som vi kan dra ett antal slutsatser från
Vad är ett centralmått och vilka finns det?
Ett centralmått är ett mått som ger en sammanfattande bild av hur en viss grupp ligger till på en viss variabel. Finns Typvärde, median och medelvärde.
Populatin vs stickprov
En population är den grupp av individer som vi vill dra slutsatser om.
Ett stickprov är en grupp individer från en större grupp/population som vi har tillgång till data om.
Vad är ett spridningsmått och vilka två har vi gått igenom?
Ett mått på hur mycket en grupp sprider ut sig när det kommer till en variabel.
Variationsbredd=högsta värde-lägsta värde
Standarsavvikelse=hur mycket avviker värderna från medelvärdet i genomsnitt
Varians
Standardavvikelsen i kvadrat. Inget vi kommer använda oss av så mycket men sätts ofta in i olika statistiska formler.
Z-poäng
Observerade värdens relativa avvikelse från medelvärdet, uttryckt i standardavvikelser. Parameter på individnivå. Hur mycket avviker ett visst värde från medelvärdet. Min längd minus medelvärdet på längden i klassen delat med standardavvikelser är lika med Z-poäng. Får man 1 i Z-poäng är man en standardavvikelse över medelvärdet.
Vad är z-värden bra för?
Är ett mått som uttrycker hur extremt ett värde är. Ju mer ett värde X:s z-poäng avviker från noll, desto mindre är sannolikheten för att ett värde ska avvika mer från medelvärdet än vad X är. Detta gör att man kan jämföra saker som till exempel: Vilket är mest sannolikt, att en svensk kvinna är mer deprimerad än 12 eller att en italiensk man har IQ<80 om man bara har medelvärde och standardavvikelser.
Vad mer är z-värden bra för?
Om man tar ett antal observerade värden och omvandlar dessa till Z-poäng så får man en ny variabel som alltid har medelvärde 0 och standardavvikelse 1. d
Korrelation
Är ett mått på styrkan och riktningen i ett linjärt samband, ligger mellan -1 och 1, så kan vara positiv (positivt k-värde om man plottar i en graf) eller negativ. Ej ett mått på kausalitet
Störande tredje variabel
En variabel som påverkar en korrelation men som inte mäts, och som betyder att det inte är en kausalitet mellan de två variablerna som mäts.