STAT100 Flashcards

1
Q

To typer data/variabler

A
  1. Kategorisk data
  2. Numerisk
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er kategorisk data? Hvilke tre typer finnes det av kategorisk data/variabler?

A

Data med forhåndsbestemte kategorier.

1- binære/dikotome: to kategorier (kvinne/mann, syk/frisk)

2- Nominale data: flere kategorier (favorittfarge, tresorter, blodtype)

3- ordinale data: ordnede kategorier (ukedager, karakter, skala)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er numerisk data? Hvilke to typer finnes?

A

Talldata.

1- diskrete data: telledata (antall barn, antall unger i kull)

2- kontinuerlig data: måledata (høyde, blodtrykk, lønn)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

To typer modeller

A

1- deterministisk modell
2- stokastisk modell

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er detministisk modell?

A

beskriver forutsigbare fenomen. Eks sammenhengen mellom volum og areal.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er stokastisk modell?

A

Beskriver tilfeldige fenomener. Kan ikke si hva som kommer til å skje, men kan angi antall mulige utfall og hvilken sannsynlighet det er for de ulike utfallene

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvilke modeller er best egnet til kategorisk data?

A
  • frekvenstabell
  • søylediagram
  • kakediagram
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvilke modeller egner seg best til kontinuerlig numerisk data?

A
  • histogram
  • boksplott
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvilke spredningsmål har vi?

A
  • modus
  • median og kvartil
  • gjennomsnitt
  • varians
  • standardavvik
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er modus?

A
  • verdien som forekommer flest ganger i et datasett.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva er median? Hvordan regne ut?

A
  • Midterste observasjonen i et datasett når verdiene er sortert.
  • Best for skjevfordelt data
  • Oddetall: midterste verdien
  • Partall: gjennomsnittet av de to midterste verdiene
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Kvartiler

A

median = 50 prosentkvartil
Q1 = medianen av verdiene under medianen. 25 prosentkvartil
Q3 = medianen av verdiene over medianen. 75 prosentkvartil

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Gjennomsnitt

A
  • Summen av alle observasjoner / antall observasjoner
  • Best for symmetrisk data
  • Kalles også middelverdi

Ẍ = 1/n * ∑(xi) = 1/n (x1 * x2 * x3)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva er standardavvik? 𝛔 / SD

A
  • Typisk avvik fra gjennomsnittsverdien
  • For å summere, må du bruke absoluttverdien til alle avvikene

S = sqrt ( ∑(xi - Ẍ)^2 / n-1)

Ved frekvenstabell:
𝜎 = sqrt(Var(x)) = sqrt(𝜎^2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva er varians? Var(X) / 𝛔^2

A
  • arealet av gjennomsnittlig avvikskvadrant

S^2 = ∑(xi - Ẍ)^2 / n-1

ved frekvenstabell:
𝜎^2 = ( ∑X^2 * (PX=x=) ) - 𝜇^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Tjebytsjevs regel

A
  • hvordan utvalgsstandardavviket henger sammen med histogrammet til observasjonene.

68% av dataen vil ville mellom Ẍ + SD

95% av daten vil ligge mellom Ẍ + 2*SD

99% av dataen vil ligge mellom Ẍ + 3*SD

17
Q

Hva er stokastiske forsøk?

A

Tilfeldige utfall

Kjennetegn:
- Vet mulige utfall
- Bare ett av utfallene er mulige
- Vet ikke resultatet på forhånd

18
Q

Uniform sannsynlighet

A

Alle hendelser har like stor sannsynlighet for å inntreffe

P(A) = antall mulig utfall for A / antall mulige utfall

19
Q

De store talls lov

A

Hvis et forsøk gjentas mange ganger vil dens frekvensbaserte sannsynlighet tilnærme seg sin teoretiske sannsynlighet

20
Q

Relativ frekvens

A

Relativ frekvens = antall ganger A har inntruffet / totalt antall forsøk (n)

21
Q

Unionen av A og B
P(A ∪ B)

A

Sannsynligheten for at A, B eller begge inntreffer

22
Q

Snittet av A og B
P(A ∩ B)

A

Sannsynligheten for at både A og B inntreffer

23
Q

Komplementet av A
P(Ā)

A

Sannsynligheten for at A ikke skal skje

24
Q

Disjunkt av A og B

A

Dersom A og B ikke kan inntreffe samtidig

25
Q

Betinget sannsynlighet

A

Sannsynligheten for at en hendelse vil inntreffe, når en annen allerede har inntruffet
P(A|B)

26
Q

Regneregler generelle

A

Komplement-regel:
P(Ā) = 1 - P(A)

Generell addisjonsregel:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)

Addisjonsregel for disjunkte hendelser (finnes ingen snitt av A og B da disse ikke kan forekomme likt):
P(A ∪ B) = P(A) + P(B)

27
Q

Regneregler betinget sannsynlighet

A

P(A|B) = P(A ∩ B) / P(B)
Snudd om ➞ (P(A ∩ B) = P(A|B)P(B) eller P(B|A)P(A))

P(B|A) = P(A ∩ B) /P(A)

P(Ā|B) = 1 - P(A|B)

Total sannsynlighet:
P(A) = P(A|B) * P(B) + P(A|Ḃ) * P(Ḃ)

28
Q

Uavhengige betingelser

A

Kunnskap om at den ene hendelsen har inntruffet endrer ikke sannsynligheten for at den andre hendelsen skal inntreffe

29
Q

Regneregler betinget sannsynlighet

A

P(A|B) = P(A) = P(A ∩ B) = P(A) * P(B)(at hendelse B har skjedd endrer ikke sannsyligheten for A)

30
Q

Bayes regel

A

Forelesning:
P(A|B) = P(B|A)P(A) / P(B|A)P(A) + P(B|Ā)*P(Ā)

Boka:
P(Bi|A) = P(A∩B) / P(A) = P(Bi) * P(A|Bi) / P(A)

31
Q

Antall kombinasjoner (med tilbakelegging)

A

Trekke K enheter fra en samling med tilbakelegging med n merkede enheter.
Antall kombinasjoner er n^k.

Eks: plante 4 planter, farget enten hvit eller rød.
K = 4 og n = 2
antall kombinasjoner: n^k = 2^4 = 16

32
Q

Antall kombinasjoner uten tilbakelegging (permutasjon/fakultet)

A

Ordnede utfall: (rekkefølge viktig)
Trekke K enheter fra en samling uten tilbakelegging med n merkede enheter.
P n,k = n! / (n-k)!
(Eks: trekke 20 baller av en hatt med 80 baller hvor det er ulike farger på ballene)

Ikke-ordnede utfall:
Trekke K enheter fra en samling uten tilbakelegging med n merkede enheter.
C nok = n! / (n-k)! * k!
(Eks: par i kortstokk- hvilke kort du får par av spiller ingen rolle)

33
Q

Diskret sannsynlighetsmodell

A

X = stokastisk variabel (eks “antall barn”)
Vx = verdiemengden til X (eks 0, 1, 2 osv.)

P(X = x) =sannsynligheten for Vx (eks: P(0 barn))

X 0 1 2
P(X=x) 1/11 4/11 6/11

Kumulativ sannsynlighet, P(X<= x)
X 0 1 2
P(X=x) 1/11 4/11 6/11
P(X<= x) 1/11 5/11 11/11

34
Q

Forventet verdi/ 𝜇 = E(X)

A

“Typisk verdi”/tyngdepunktet

diskrete: ∑(X * P(X = x))

kontinuerlige: ∫ X* f(X) dx