Föreläsning 4 - Datahantering Flashcards

1
Q

Hur ser processen ut för att hantera data?

A
  1. Skapa struktur
  2. Mata in data
  3. Rengöra data
  4. Beskriv data
  5. Omvandla data (valfri)
  6. Skapa en kodbok
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Om man manuellt måste mata in data, vad är viktigt att se upp för?

A

Fel värden
Dubletter
Missade data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

När man rengör data, vad bör man tänka på?

A

Felaktigt inmatade data
Misstänkt svarsmönster
Hantera extremvärden
Hanterade missade data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Att fånga felaktigt inmatade data är lika viktigt som att inte mata in dåliga data på egen hand. Hur kan sådant uppstå?

A

I en situation där intervjuaren har influerat svaren som samlats in. Kan göras medvetet eller omedvetet.

Datainmatningsfel från undersökningsteamet eller från respondenten som av misstag matat in fel data tex stavat fel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vissa svarsmönster borde väcka misstanke, vilka?

A

Straight liners: en respondent ger samma svar på alla frågor, dvs bara klickar sig igenom. Man kan hitta detta genom att använda omvända skalor på vissa frågor.

Inkonsekventa svar: en respondent svarar olika på samma frågor eller svar som går i konflikt med varandra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Det finns tre typer av extremvärden, vilka?

A

Misstag
Enstaka ytterligheter
Kombinerade ytterligheter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vilka typer av missade data finns?

A

Inga svar i enkäten från en respondent
Alla frågor är inte besvarade av en respondent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Det finns tre fall av missade data, vilka?

A

MCAR: data är borta slumpmässigt

MAR: den missade datan är beroende av en variabel

MNAR: den missade datan är beroende på svaret på frågan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Nämn exempel på univariata grafer och tabeller.

A

Histogram, stapeldiagram, box plot, frekvenstabell

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad säger univariat statistik?

A

Ger oss en uppfattning om hur värden fördelas för en enskild variabel.

Exempelvis medelvärde, median, utspridning (varians och standardavvikelse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är skewness och kurtosis?

A

Båda är mått på karaktär på en normalfördelning.

Skewness = symmetrin på fördelningen. Negativ betyder längre svans åt vänster, positiv tvärtom.

Kurtosis = hur spetsig fördelningen är. Låg betyder en mer flack topp, hög tvärtom.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad säger bivariat statistik?

A

Beskriver relationen och sambanden mellan två variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Nämn grafer och tabeller för bivariat statistik.

A

scatter plot, crosstabs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är kovarians?

A

Beskriver i vilken utsträckning två variabler varierar gemensamt. Svår att använda i praktiken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är korrelation?

A

Beskriver sambandet mellan två variabler. Mycket lättare att använda i praktiken.

0,00<r<0,30 –> svagt samband.
0,30 < r < 0,49 –> medel samband.
0,50 < r < 1,00 –> stark

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad gör Chi-square test?

A

Testar ifall fördelningen av en kategori följer den förväntade fördelningen.

17
Q

När använder man ett one-sample chi-square test?

A

När man vill testa om fördelningen över en kategori följer den förväntade fördelningen.

18
Q

När använder man chi-square test of independence?

A

När man vill testa för flera kategorier.

19
Q

Vad är kraven för chi-square?

A

inga frekvenser som är 0
Förväntade frekvenser ska vara större än 5

20
Q

På vilka två sätt kan data omvandlas?

A

Genom att omdefiniera variabeln, tex från kontinuerlig till kategorisk.

Genom att omvandla skalan.

21
Q

Vilken struktur gäller för en kodbok?

A

Introduktion
Frågor
Variabeldefinitioner
Deskriptiv statistik
Datasets