2. Hvordan Beskrive Data Flashcards

1
Q

Hva er en variabel?

A

• Kvantitativ metode er basert på at egenskaper i verden kan uttrykkes i form av variabler.
• Egenskaper uttrykt som variabler kan sammenlignes og måles.
• Variabler må ha variasjon.
• To hovedvarianter:
○ Numeriske/skalaer (kvantitative)
○ Nominale/kategoriske (kvalitative)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Fire ulike målenivåer av variabler:

A

Nominalskala
Ordinalskala
Intervallskala
Ratioskala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nominalskala

A

Ulike kategorier eller klasser av observasjoner. (epler og bananer)
○ Diagnoser er på nominalskala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Ordinalskala

A

Rangering mellom kategorier i en rekkefølge. (mer eller mindre, men ikke en bestemt avstand mellom kategorier)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Intervallskala

A

Når det er lik avstand mellom punktene på skalaen. (for eksempel klokken; like langt fra 2-4 som 4-6).
○ Hvis man kombinerer mange spørsmål på en ordinalskala som handler om det samme, kan man si at gjennomsnittet av disse havner på intervallskalaen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ratioskala

A
Absolutt nullpunkt (samme egenskaper som de tidligere, men også et absolutt nullpunkt. Kelvin skala)
	○ Mål på personlighet og mennesker er sjelden på ratioskala.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Korrelasjon

A

Et tall mellom -1 og +1, 0 er ingen korrelasjon, høyere betyr mer korrelasjon (og rettere linje i scatter plot). Negativ er også mer korrelasjon men med motsatt fortegn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Ulike mål på sentraltendens:

A

Modalverdi: vanligste observasjon, mest frekvent.
Median: den verdien som deler fordelingen i to like store deler.
Gjennomsnitt: Aritmetisk middelverdi: (X̄)= (Σx)/(N)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ulike mål på spredning:

A

Spredning kan være 0, men aldri negativ.
• Variasjonsbredde (range): Høyeste verdi - laveste verdi.
• Interkvartil variasjonsbredde (range):
○ Del opp fordelingen i 4 kvartiler
○ Finn skåren for 25% persentilen og 75%persentilen
○ 75 persentil - 25 persentil

• Standardavvik: ved ratio eller intervall (der en bruker aritmetisk gjennomsnitt)
○ Måler hvor langt unna gjennomsnittet det er vanlig å ligge.
○ Kan tolkes som gjennomsnittlig absolutt avstand til gjennomsnittet.
○ Formelt definert som: kvadratroten av gjennomsnittlig kvadrert avvik fra gjennomsnittet: Men er litt annerledes:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Scatter plot:

A

Diagram som viser hvert par av verdier (X,Y) i et datasett som et punkt i planet. ○ En tendens til en linje viser samvariasjon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Sentralgrenseteoremet:

A

En sum av uavhengige og identisk fordelte tilfeldige variabler går mot en normalfordeling når antallet går mot uendelig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Store talls lov:

A

Forskjellen mellom det observerte og forventede gjennomsnittet (av et sett med likt fordelte tilfeldige/stokastiske) variabler går mot null når antall observasjoner går mot uendelig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Normalfordeling:

A

En helt bestemt statistisk fordeling i form av en gaussisk kurve. Hvor 34,1% ligger mellom gjennomsnitt og 1 standardavvik, 13,6% ligger mellom 1 og 2 SD.
○ Mange ting er normalfordelt i befolkningen, som høyde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Z-skårer:

A

Enstandardskår, en måte å regne ut hvor mangestandardavviken statistikk er fragjennomsnittet.
○ ( i psykologien har vi ingen universell skalaer som C eller cm, derfor bytter vi tilfeldige skalaer ut med z-skårer)
• En omforming av skåren til standardskårer basert på gjennomsnitt og standardavviket kan sammenligne data fra ulike skalaer.
• Beregnes ved formelen: Z=X-X̄/SD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Avvik fra normalfordeling: skjevhet

A

Positiv skjevhet hvis få lite og mange mye

Negativ skjevhet hvis mange lite og få mye

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Avvik fra normalfordeling: mindre eller større haler

A

Kurtose
○ Leptokurtisk hvis lite haler
○ Platykurtisk hvis større haler
○ Mesokurtisk hvis normal

17
Q

Varians:

A

Mål på spredning: Gjennomsnittlig kvadrert avvik fra aritmetisk gjennomsnitt
○ Et steg på veien til standardavviket, men også interessant i statistikken. Inngår i ulike statistiske analyser.
σ^2

18
Q

Standardavvik: σ:

A

Mål på spredning ved ratio eller intervall (der en bruker aritmetisk gjennomsnitt)
○ Måler hvor langt unna gjennomsnittet det er vanlig å ligge.
○ Kan tolkes som gjennomsnittlig absolutt avstand til gjennomsnittet.
○ Formelt definert som: kvadratroten av gjennomsnittlig kvadrert avvik fra gjennomsnittet: Men er trekker 1 fra utvalgstørrelsen når det er i et utvalg og ikke i en hel populasjon.

19
Q

Hva er beskrivende statistikk?

A

Beskrivende statistikk er et verktøy for å beskrive data. En generell oversikt over data.

Beskrivende statistikk har to formål:
å undersøke antagelser man hadde før datainnsamlingen
begynte, altså hypoteser.
å undersøke om materialet kan kaste nytt lys over problemet du er opptatt av (eksplorerende dataanalyse).

Kan hjelpe deg å avsløre feilkilder i datamaterialet som har betydning for senere dataanalyse.

20
Q

Hva er slutningsstatistikk?

A

Her er målet å si noe om populasjonen ut fra de resultater som observeres i utvalget.

21
Q

Parametrisk statistikk?

A

Parameter er kjennetegn ved populasjonen.

Statistikken gir karakteristika i utvalget

22
Q

Variasjonsbredde (range):

A

 Høyeste verdi – laveste verdi.

 F.eks. alder 34 – 18 = 16

23
Q

Interkvartil variasjonsbredde (range):

A

 Del opp fordelingen i 4 kvartiler
 Finn skåren for 25% persentilen og 75% persentilen.  75 persentil – 25 persentil
 eks.alder28–21=7

24
Q

Standardavviket er kvadratroten av?

A

Variansen, som er definert som: Gjennomsnittlig kvadrert avvik fra aritmetisk gjennomsnitt.
SD=σ=√σ^2=√s^2

25
Q

Frekvensfordeling:

A
Gir et grafisk uttrykk for hvordan data er organisert.
Viktige ting å legge merke til er:
 Midtpunktet i fordelingen
 Spredningen av
enkeltobservasjoner
 Modalitet
 Skjevheter (avvik fra normalfordeling)
 Uteliggere