Statistik Flashcards
Vad har man statistik till, vad fyller det för funktion?
- Mycket av forskningen baseras på olika
typer av statiska analyser. - Ge en bild av hur saker och ting är
(deskriptiv statistik) - Dra slutsatser om hur saker och ting kan
tänkas vara (inferentiell statistik) - Objektivitet
Vad är en variabel? Ge ett konkret exempel.
Egenskap som kan variera. Ex: Inkomst, grad av depression, behandlingsgrupp
Beskriv de fyra datanivåerna (med namn, vad som karakteriserar dem och med exempel på variabler på de olika nivåerna).
- Nominaldata: Individer (eller vad man nu undersöker) kan ha olika värden, men värdena kan inte rangordnas. Exempel: Födelseland.
- Ordinaldata: 1 + värdena kan rangordnas, men det finns inte ekvidistans, alltså varje skalsteg är inte lika stort. Exempel: Placering i mål vid ett maratonlopp (1, 2, 3, etc.) som ett mått på löphastighet.
- Intervalldata: 1 + 2 + vi har ekvidistans, men inte någon absolut nollpunkt, vilket innebär att vi inte kan beräkna kvoter. Exempel: Grad av depression på en Likert-skala från 1 till 7. Grader i Celsius.
- Kvotdata: 1 + 2 + 3 + absolut nollpunkt, vilket innebär att vi kan bilda kvoter. Exempel: Längd i centimeter.
Beskriv tre olika typer av centralmått (vad de heter och vad de anger).
Ger en sammanfattande bild av hur en viss grupp ligger till på en viss variabel.
Typvärdet = Det vanligaste värdet
Medianen = Det mittersta värdet
(det aritmetiska) medelvärdet = summan av alla observerade värden dividerat med antalet värden
Beskriv tre olika typer av spridningsmått (vad de heter och vad de anger).
Ger en bild av hur en grupp sprider ut sig på en variabel.
Variationsbredden = Skillnaden mellan det största och det minsta värdet
Standardavvikelse ≈ Hur mycket observerade värden i genomsnitt avviker från medelvärdet.
Varians = SD i kvadrat
Vad anger Z-poängen?
Z-poäng anger hur många standardavvikelser ett värde är från medelvärdet 0.
Man omvändlar till z-poäng för att man sällan känner till standardavvikelsen i populationen.
Den används för att jämföra ett enskilt värde med en fördelning och visar hur extremt eller vanligt ett värde är i relation till andra.
Ange två karaktärsdrag för s.k. Z-transformerade variabler.
Medelvärdet är 0 och sd är 1.
Hur många SD ett värde avviker från medelvärdet.
Ju mer ett värde X:s Z-poäng avviker från noll, desto mindre är sannolikheten för att ett värde skall avvika mer från medelvärdet än vad X gör.
Vad anger ett korrelationsvärde?
Ett mått på styrkan och riktningen i ett linjärt samband.
- Kan variera mellan -1,0 och +1,0
- Positivt eller negativt (eller noll)
- Ju starkare samband, desto mer avviker från noll
- Ej bevis på kausalitet
Vilka värden kan en korrelation anta?
Värden mellan, och inkluderat, -1 och +1.
Vad är ett s.k. ”starkt samband”?
Ju starkare samband, desto mer avviker från noll.
Argumentera, gärna med exempel, för det korrekta i påståendet ”korrelation bevisar ej kausalitet”.
En korrelation mellan två variabler X och Y kan bero på att båda påverkas av en tredje variabel Z snarare än att någon av X och Y har en kausal effekt på den andra. Om vi t.ex.
skulle mäta intelligens och längden på byxorna.
Vad heter den vanligaste korrelationskoefficienten?
Pearsons produktmomentkorrelationskoefficient.
Hur tenderar ”medelvärdet för stickprovsmedelvärden” att förhålla sig till “medelvärdets för enskilda värden”?
Ju närmre Z-poäng för “medelvärdet för stickprovsmedelvärdet” är till 0, desto högre sannolikhet att “stickprovsmedelvärdet” inte avviker från “medelvärdet för enskilda värden”
Dvs. större urval ger värdet som är närmre tex en populations medelvärde.
Hur tenderar ”standardavvikelsen för stickprovsmedelvärden” att förhålla sig till ”standardavvikelsen för enskilda värden”?
“Standardavvikelsen för stickprovsmedelvärden” är alltid mindre än (eller lika med) “standardavvikelsen för enskilda värden”
Vad kallas ”standardavvikelsen för stickprovsmedelvärden”?
SE, medelfelet (eng. standard error)