STAT100 Flashcards
To typer data/variabler
- Kategorisk data
- Numerisk
Hva er kategorisk data? Hvilke tre typer finnes det av kategorisk data/variabler?
Data med forhåndsbestemte kategorier.
1- binære/dikotome: to kategorier (kvinne/mann, syk/frisk)
2- Nominale data: flere kategorier (favorittfarge, tresorter, blodtype)
3- ordinale data: ordnede kategorier (ukedager, karakter, skala)
Hva er numerisk data? Hvilke to typer finnes?
Talldata.
1- diskrete data: telledata (antall barn, antall unger i kull)
2- kontinuerlig data: måledata (høyde, blodtrykk, lønn)
To typer modeller
1- deterministisk modell
2- stokastisk modell
Hva er detministisk modell?
beskriver forutsigbare fenomen. Eks sammenhengen mellom volum og areal.
Hva er stokastisk modell?
Beskriver tilfeldige fenomener. Kan ikke si hva som kommer til å skje, men kan angi antall mulige utfall og hvilken sannsynlighet det er for de ulike utfallene
Hvilke modeller er best egnet til kategorisk data?
- frekvenstabell
- søylediagram
- kakediagram
Hvilke modeller egner seg best til kontinuerlig numerisk data?
- histogram
- boksplott
Hvilke spredningsmål har vi?
- modus
- median og kvartil
- gjennomsnitt
- varians
- standardavvik
Hva er modus?
- verdien som forekommer flest ganger i et datasett.
Hva er median? Hvordan regne ut?
- Midterste observasjonen i et datasett når verdiene er sortert.
- Best for skjevfordelt data
- Oddetall: midterste verdien
- Partall: gjennomsnittet av de to midterste verdiene
Kvartiler
median = 50 prosentkvartil
Q1 = medianen av verdiene under medianen. 25 prosentkvartil
Q3 = medianen av verdiene over medianen. 75 prosentkvartil
Gjennomsnitt
- Summen av alle observasjoner / antall observasjoner
- Best for symmetrisk data
- Kalles også middelverdi
Ẍ = 1/n * ∑(xi) = 1/n (x1 * x2 * x3)
Hva er standardavvik? 𝛔 / SD
- Typisk avvik fra gjennomsnittsverdien
- For å summere, må du bruke absoluttverdien til alle avvikene
S = sqrt ( ∑(xi - Ẍ)^2 / n-1)
Ved frekvenstabell:
𝜎 = sqrt(Var(x)) = sqrt(𝜎^2)
Hva er varians? Var(X) / 𝛔^2
- arealet av gjennomsnittlig avvikskvadrant
S^2 = ∑(xi - Ẍ)^2 / n-1
ved frekvenstabell:
𝜎^2 = ( ∑X^2 * (PX=x=) ) - 𝜇^2