Föreläsning 1 - Intro Flashcards
Population
Alla medlemmar i en viss kategori
Stickprov
en delmängd av populationen
Parameter
En sammanfattande kvantitet/en siffra som beskriver populationen
statistika
en sammanfattande kvantitet/siffra som beskriver stickprovet
deskriptiv statistik vs inferensstatistik
Deskriptiv statistik: sammanfattar stickprovsdata kortfattat med olika statistika. Ex. medelvärde, standardavvikelse, median etc.
Inferensstatistik: använder stickprovsdata för att dra slutsatser om populationen.
Hypotes
En kvalificerad gissning avseende någon kvantifierbar egenskap i populationen
H0
Det är ingen skillnad mellan två grupper/betingelser avseende någon beroende variabel. Alternativt inget samband mellan två variabler i populationen.
H1
Det finns en skillnad mellan grupper/betingelser i populationen avseende beroende variabel. Alternativt det finns en korrelation mellan två variabler i populationen.
Parametrisk statistik
Då det är möjligt att estimera parametrar, dvs populationens medelvärde och standardavvikelse från stickprovet. Förutsätter bland annat:
- Data på kvot eller intervallskala
- Ungefär normalfördelning (om små stickprov)
- Lika/homogen varians mellan grupper
Skalnivåer
- Kvotskala: svarsalternativen är rangordnade med specifika avstånd till varandra och det finns en given nollpunkt.
- Intervallskala: svarsalternativen är rangordnade och har specifika avstånd till varandra, men det finns ingen given nollpunkt.
- Ordinalskala: svarsalternativen är rangordnade men avstånden mellan alternativen kan inte avgöras.
- Nominalskala: svarsalternativen saknar rangordning, räkna antal i olika kategorier.
Skewness
Sned fördelning. Skewness är ett mått som används för att beräkna hur sned fördelningen är i relation till normalfördelning.
- Skewness 0 = normalfördelning
- Negativ skewness = en fördelning med “svansen” åt vänster.
- Postitiv skewness = en fördelning med “svansen” åt höger.
Kurtosis
Kurvans “toppighet”.
- Kurtosis 0 = normalfördelning.
- Positiv kurtosis = toppigare fördelning än normalfördelningen.
- Negativ kurtosis = plattare fördelning än normalfördelningen. Eller då mittenvärdena har lägre frekvens än yttervärdena.
Standardfelet
Ett estimat av avvikelsen mellan medelvärden (om vi hade upprepat testet på många stickprov).
Centrala gränsvärdessatsen
Då stickprovsstorleken (antal stickprov) är tillräckligt stort kommer fördelningen av stickprovsmedelvärden närma sig normalfördelningen oavsett hur de enskilda stickprovens fördelningar ser ut. Även om populationen inte är normalfördelad.
p-värde (Fishers signifikanstestning)
Sannolikheten att erhålla ett resultat som är minst så extremt som det faktiskt erhållna resultatet om H0 vore sann. P är en egenskap hos data.