Statistik 1 Flashcards

1
Q

Vad är variationsbredd?

A

Högsta värdet minus lägsta värdet i datamängden.
Användbart då datafördelning är mycket sned, bimodal, rektangulär

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är en kvartilavvikelse

A

Kvartilavvikelser bygger på percentiler
En percentil är det värde under vilket en viss procentandel ligger
så vid percentil 50 (medianen) finns 50% av datamängden under.
Då percentiler delar in datamängden i fjärdedelar kallas det kvartiler.
Kvartilavvikelsen är (q3-q1) /2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

spridningsmått

A

sammanfattade mått över hur mätvärderna är utspridda i datamängden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

standardavvikelser

A

är på sätt och vis ett mått på observationernas genomsnittliga avstånd från medelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Frihetsgrader

A

antalet frihetsgrader är det antal värden som återstår, som har “frihet att variera”, när man har subtraherat det totala antalet restriktioner från antalet värden.
En restriktion orsakas av ett mått som beräknats från värden (ex: medelvärdet)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Varians

A

genomsnittliga kvadrerade avvikelsen från medelvärdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Z-poäng

A

värden på olika skalor kan översättas till z-poäng och då jämföras.
Z-poänget talar om hur långt ifrån medelvärdet en observation befinner sig, i standardavvikelser beräknat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hur räknas z-poäng?

A

Räkna ut skillnad mellan värde och medelvärdet för populations/ stickprov
Får avstånd till medelvärdet

Delar avståndet med standardavvikelse för population/stickprov

Nu har vi antalet standardavvikelser första värdet är ifrån medel poäng = z-poäng

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Normalfördelning

A

hur datan är fördelad, om den är normalfördelad är den klockformad, symmetrisk och mellan två värden återfinns alltid en bestämd proportion av alla observationer:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad avgränsar z-värdena +-1.96?

A

95% av observationerna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad innebär skewness?

A

hur sned en fördelning är i jämförelse med normalfördelning
Ett värde på 0 = helt symmetrisk
- värde = svansen åt vänster
+ värde = svansen åt höger

Värden utanför +-2 = kraftigt snefördelad

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad är kurtosis?

A

graden av toppighet i kurvan.
0 = lika toppig som normalfördelning
+ värde = toppigare än normalfördelning (starkt koncentrerad i mitten)
- värde = plattare än normalfördelning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad kan beräknas med z-värde och normalfördelning?

A

Sannolikheten för ett visst utfall
Ex: befinner du dig över standardavvikelse 1, är sannolikheten att en slumpmässig persons värde också är över 1 standardavvikelse 15,86%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är en korrelation?

A

Ett mått på graden av samvariation mellan två variabler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är ett skensamband?

A

Ett samband eller korrelation som orsakats av en bakomliggande variabel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad innebär positiv/negativ samband

A

Om sambandet är positivt eller negativt informerar om sambandets riktning.
samband mellan 2 variabler kan vara:
Positivt = ökning i X variabeln ger även ökning i Y variabeln
Negativ = ökning i X variabeln leder till minskning i Y variabeln.

17
Q

Vad är extremvärden?

A

enstaka eller få värden som är avstickare ifrån resterande data. Dessa kan kraftigt påverka korrelationskoefficienten.
En graf/punktdiagram kan användas för att avslöja extremvärden

18
Q

Pearsons produktkorrelationskoefficient

A

Vanligaste sättet att beräkna en korrelation och mäter graden av linjär samvariation.

19
Q

Hur räknas Pearsons r?

A
  1. Översätta talparen till z-poäng
  2. Multiplicera de z-transformerade talen inom varje par med varandra
  3. Addera alla z-produkterna ihop
  4. Dela summan med antalet talpar minus 1 (n-1)
20
Q

Hur vet man om sambandet är stort?

A

Det kan bero på:
- vad för förväntningar som fanns på resultatet
- vad tidigare forskning har visat
- hur signifikant resultatet är

Man kan även använda cohens riktlinjer:
- Svagt samband - r =0,1
- Medelstarkt - r = 0,3
- Starkt - r =0,5

21
Q

Vad är determinationskoefficienten

A

Det kvadrerade r värdet.
Det anger proportion förklarad varians och kan ge tydligare bild av korrelationens styrka.
Det är så mycket av variansen, eller spridningen, i ena variabeln som kan förklaras av den andra.

22
Q

Spearmans rangkorrelationskoefficient

A

Spearmans räknar ut en korrelation likt pearsons men med variabler på ordinalskalnivå (rangskala)

23
Q

Antaganden för pearsons r

A
  1. intervall/kvotnivå
  2. data i talpar
  3. normalfördelning
  4. inga extremvärden
  5. homoscedasticitet
  6. linjärt samband
24
Q

Antaganden för Spearman

A
  1. båda variabler på ordinalnivå
  2. icke-parametrisk
  3. fördel att använda vid extremvärden
  4. fördel att använda vid snedfördelning
  5. fungerar vid heteroscedasicitet
  6. monotonistiskt samband (behöver ej vara linjärt)
25
Q

Vad innebär restriction of range?

A

Vid begränsad spridning/variation hos våra variabler och ju mindre variation, desto svårare att få samvariation.

26
Q

Vad är partiell korrelation?

A

Partiell korrelation är en uträkning som används för att utesluta eller bevisa en bakomliggande variabel mellan korrelationen.

27
Q

Hur beräknas partiell korrelation?

A

När man beräknar en partiell korrelation räknar man ut korrelationen mellan vardera variabel och en tredje variabel som tros kunna vara en medlande faktor.
Man har då kontrollerat för den tredje faktorn i korrelationen.

28
Q

Vad är frekvens (frekvenstabeller)?

A

antal förekomster av något variabelvärde.
I frekvenstabeller redovisas antalet eller frekvenserna för de olika variabelvärdena
Summan av frekvenserna ska alla bli densamma som totala deltagarna (n)

29
Q

Relativa frekvenser

A

Frekvens andelen, angivet i procent.
Antalet förekomster av något variabelvärde dividerat med det totala antalet.

30
Q

Kumulerade frekvenser

A

kumulativt summerade frekvenser
Frekvenser adderas nedåt.

31
Q

Vad är klassindelat material?

A

vid kvantitativa variabler är det ofta praktiskt att klassindela material - då samlas flertal värden till en “klass” eller grupp.
Det är bra att ha klasser som är lika stora

32
Q

Hur kan man klassindela?

A

Utifrån bestämd klassbredd:
- dividera variationsbredden med valda klassbredden och avrunda uppåt för estimat på antal klasser

Utifrån antal klasser:
- Räkna ut variationsbredd
Sedan dividera med antal klasser för att få estimat på klassbredden

33
Q

Vad menas med större spridning?

A

Men större spridning kan man tänka att fördelningskurvan blivit uttryckt.
Vid lägre spridning är kurvan mer centraldragen, eller dragen åt ett visst håll - man kan tänka sig att den har högre topp.