Kap 1-3 del 2 Flashcards

1
Q

Vad är en frekvensfördelning?

A

Den grupperar datan i kategorier och registrerar antalet observationer som hamnar i varje kategori.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är den relativa frekvensen för varje kategori?

A

andelen observationer i varje kategori. Relativ frekvens = frekvens / urvals storlek.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är ett stapeldiagram?

A

Det avbildar frekvensen eller den relativa frekvensen för varje kategori av den kategoriska variabel som en serie staplar. Längden på staplarna är proportionella med de värden som avbildas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är ett cirkeldiagram?

A

En segmenterad cirkel vars segment avbildar den relativa frekvensen av varje kategori för en kategorisk variabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vilka riktlinjer finns för att datan inte ska bli snedvriden?

A

Tydlighet, märk axlar, samma bredd på staplar, rimliga värden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hur gör vi frekvensfördelning för numeriska variabler?

A

Vi konstruerar istället en serie intervall (klasser).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hur bestämmer vi bredden på varje intervall?

A

Vi tar (maximum-minimum) / antal intervall. Antalet intervall brukar vara mellan 5 och 20.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad är en Kumulativ frekvensfördelning?

A

Visar antalet observationer som faller under den övre gränsen för ett visst intervall. Den kumulativa relativa frekvensen för ett visst intervall indikerar proportionen av observationerna som faller under den övre gränsen för det specifika intervallet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur kan den kumulativa frekvensen beräknas?

A
  1. summera på varandra följande relativa frekvenser,
  2. dividera varje intervalls kumultativa frekvens med urvalsstorleken.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är Kumulativ relativ frekvensfördelning för en numerisk variabel?

A

Registrerar andelen av observationer som faller under den övre gränsen för ett särskilt intervall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är Relativ frekvensfördelning för en numerisk variabel?

A

Registrerar andelen av observationer i varje intervall

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad är kumulativ frekvensfördelning för en numerisk variabel?

A

Registrerar antalet observationer som faller under den övre gränsen för ett särskilt intervall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad är ett histogram?

A

Numeriska variablers variant på stapeldiagram. Ett histogram är en serie rektanglar där bredden och höjden på Varje rektangel representerar intervallbredden och frekvensen för det respektive intervallet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är en polygon?

A

Den förbinder en serie intilliggande punkter där varje punkt representerar mittpunkten för ett särskilt intervall och dess tillhörande frekvens eller relativ frekvens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är en ogiv?

A

Den framställer en kumulativ frekvens eller kumulativ relativ frekvens och ansluter en serie intilliggande punkter där varje punkt representerar den övre gränsen för ett specifikt intervall och dess associerade kumulativa frekvens eller kumulativa relativa frekvens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad är en scatterplot?

A

En scatterplot är ett grafiskt verktyg som hjälper till att avgöra om två numeriska variabler är relaterade på något systematiskt sätt och dra slutsatser om deras relation.

17
Q

Hur markeras en scatterplot med en kategorisk variabel?

A

genom olika färger på prickarna.

18
Q

Vad är en linjeplott?

A

Den kopplar samman på varandra följande observationer av en numerisk variabel med en linje. Används för att följa förändringar i variabeln över tid.

19
Q

Vad är ett stem-och-leaf diagram?

A

Det konstrueras genom att separera varje observation av en numerisk variabel i två delar. en stam och ett blad. Stammen består av de vänstra siffrorna (alla utom sista) och bladet av den sista. Ger en översiktsbild över hur observationerna är centrerade och hur de sprider sig runt centrum.

20
Q

Vad innebär termen centraltendens?

A

Den refererar till hur numerisk data tenderar att samlas runt något ”mittvärde” eller centralvärde.

21
Q

Vad är det aritmetiska medelvärdet?

A

Det räknas ut genom att lägga samman alla observationer och dela det med antalet observationer. Medelvärdet används omfattande inom statistiken, men dess svaghet är om något värde är väldigt mycket högre eller väldigt mycket lägre än de andra så ger de en vilseledande beskrivning. Utstickare/outliers kallas de värdena. Medelvärdet är det primära måttet på centraltendens.

22
Q

Vad är Medianen?

A

Den mellersta observationen i ett urval eller population. Beräknas som mellersta observationen om n är udda eller genomsnittet av de två mellersta observationerna om n är jämnt. Medianen är särskilt användbar när det förekommer utstickare.

23
Q

Vad är Typvärde?

A

Den observation som förekommer mest frekvent i ett urval eller en population. En variabel kan både ha ett, flera eller inget typvärde. Ett typvärde: unimodal fördelning. Två typvärden : bimodal fördelning. För att sammanfatta kategoriska variabler är typvärdet enda meningsfulla måttet för centraltendens.

24
Q

Vad gäller för medelvärdet, medianen och typvärdet vid en symmetrisk fördelning?

A

De är lika.

25
Q

Hur många procent ligger inom en, två och tre standardavvikelser från medelvärdet enligt Empiriska regeln?

A

Ca 68% inom en standardavvikelse
Ca 95% inom två standardavvikelser
Ca 99.7% inom tre standardavvikelser

26
Q

Hur många procent ligger inom två och tre standardavvikelser från medelvärdet enligt Chebyshevs sats?

A

Minst 75% av observationerna ligger inom två standardavvikelser
Minst 89% av observationerna ligger inom tre standardavvikelser