Statistikk (kvantitativ analyse) Flashcards

1
Q

To typer statistikk

A

Beskrivende/deskriptiv statistikk innebærer teknikker som hjelper oss med å oppsummere dataene, bla. korrelasjon mellom variabler, spredning og sentraltendens.

Induktiv/normativ statistikk innebærer hvordan vi forsøker å bruke data for å trekke konklusjoner om populasjoner, gjennom bla. sannsynlighet, hypotesetesting og signifikans.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Variabel

A

En variabel er noe som varierer, og identifiserer fenomener som kan endre verdi. Den avhengige variabelen er dataene våre, som ikke er under vår kontroll. Altså utfallsvariabelen som blir påvirket av noe. Den uavhengige variabelen er den forskeren manipulerer eller kontrollerer for å kunne måle dens effekt på de avhengige variablene.

Et eksempel kan være barns evne til å huske tall, som kan være den avhengige variabelen ettersom forskeren ikke kan gjøre noe med dette. Forskeren kan imidlertid gjøre noe med læringsmetoden, som da kunne vært den uavhengige variabelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Målenivåer

A

For å tilordne en person en verdi på en variabel så benytter vi ulike målenivåer; nominal-, ordinal-, intervall- og forholdstalls-nivå.

Variabler på nominalnivå kategoriseres ved å sette merkelapper på forskjellige typer data, f.eks. kjønn eller etnisitet.
Variabler på ordinalnivå rangeres langs et kontinuum, uten å måle avstanden mellom posisjonene, f.eks. 1., 2. og 3. plass i en test.
Variabler på intervallnivå har intervaller med samme verdi over hele skalaen, f.eks. temperatur i celsius.
Variabler på forholdstallsnivå/ratio har like intervaller, men har et absolutt nullpunkt, f.eks. høyde og vekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Kategoriske variabler

A

Variabler på nominal- og ordinalnivå betegnes ofte som kategoriske variabler, etter som avstanden og ordningen på tallverdiene ikke er definert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Kontinuerlige variabler

A

Variabler på de andre nivåene samt sentraltendens og spredning, gjerne betegnes som kontinuerlige variabler. Disse kan anta alle verdier, ofte innenfor et bestemt intervall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Korrelasjon

A

Korrelasjon kan defineres som en samvariasjon eller sammenheng mellom to variabler. Kausalitet må ikke blandes med korrelasjon.
Korrelasjonen sier bare at det er en sammenheng, ikke noe om retningen, altså at den ene variabelen ikke nødvendigvis er årsak til den andre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Kausalitet

A

Kausalitet går ut på at årsaken produserer en virkning. Det oppstår en årsakssammenheng, og vi får en retning på denne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Positiv korrelasjon

A

En positiv korrelasjon betyr bare at høye verdier av den ene variabelen ofte vil finnes sammen med høye verdier av den andre. F.eks. finner vi gjerne positiv korrelasjon mellom røyking og lungekreft, eller antall studietimer og karakter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Andre forklaringer på korrelasjon (ikke kausalitet)

A

Vet ikke hvilken variabel som forårsaker den andre (retningen). Påvirkningen kan være gjensidig. Eller tredjevariabel/utenforliggende variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Tredjevariabelproblemet

A

Tredjevariabelproblemet, som vi ofte har i ikke-eksperimentelle design, kan illustreres med eksempelpåstanden «det å spise iskrem fører til drukning». Vi kan fint finne en positiv korrelasjon her, men sammenhengen vil være spuriøs, dvs. at sammenhengen skyldes bakenforliggende variabler, som f.eks. økt temperatur og flere som bader.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Statistisk signifikans

A

Sammenheng/forskjell/endring er ikke sannsynlig å ha oppstått tilfeldig.

Henger sammen med hypotesetesting.
Betyr ikke at vi har funnet kausalitet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Mål for sentraltendens

A

Sentraltendens = fellesbetegnelse på ulike «gjennomsnittsmål»
- Det aritmetiske snitt = er egentlig gjennomsnittet. Man legger sammen alle tallene i et sett og deler på antall tall i settet. Dette forteller oss noe om sentraltendensen for settet, eller den mest typiske verdien.
- Median = det midterste tallet i et sett når verdiene står i stigende rekkefølge. Et annet mål for sentraltendens som ikke innebærer de samme problemene som snittet når datasettet inneholder ekstreme verdier.
- Modus/typetall = verdien som forekommer mest frekvent i settet, og om det er to kalles det bimodalt. Et annet verktøy for å måle sentraltendensen. Snitt og median kan ikke regnes ut på en nominell skala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Mål for spredning

A

Spredning = et mål for hvor mye eller lite verdiene i et sett varierer i forhold til sentraltendensen.
- Variasjonsbredde = avstanden mellom den høyeste og laveste verdien i et tallsett.
- Kvartilavvik = avstanden mellom de to verdiene som markerer endepunktene for den øverste og laveste fjerdedelen (25%) av skårene i stigende rekkefølge.
- Gjennomsnittsavvik = forskjellen mellom skåren og gjennomsnittet i datasettet.

Varians = et mål på spredningen av tallene rundt gjennomsnittet. Tar kvadratet av hver avviksskåre og legger den sammen, deretter deler på antall verdier i settet.
- Standardavvik = kvadratroten av variansen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Samvariasjon mellom variabler

A

Korrelasjonskoeffisient = gir et numerisk sammendrag på retningen og styrken på det lineære forholdet mellom to variabler.

Når prediksjon er mulig, er det fordi det foreligger samvariasjon.
- Jo sterkere korrelasjon, jo bedre kan vi predikere.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Effektstørrelse

A

Dersom du skal sammenligne forskjeller eller sammenhenger innad eller på tvers av studien, benytter vi effektstørrelser (mellom 0 og 1). Det er bare i eksperimentelle design at man har tilstrekkelig kontroll med andre variabler til å vite hva forskjellen er en effekt av.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Eksempel på effektstørrelse

A

Dersom vi ønsker å finne ut av forholdet mellom to eller flere normalfordelte avhengige intervallvariabler, kan vi benytte oss av Pearson korrelasjonskoeffisienter (r), som tar verdier fra -1 til +1. Tegnet foran indikerer om det er en positiv korrelasjon (når en variabel øker, gjør den andre det også), eller en negativ korrelasjon (når en variabel øker, synker den andre). Jo sterkere korrelasjon, jo bedre kan vi predikere. En korrelasjonskoeffisient kan altså gi et numerisk sammendrag på retningen og styrken på det lineære forholdet mellom to variabler.

17
Q

Nullhypotesen

A

I det aller meste av forskning har vi en forskningshypotese, dannet på bakgrunn av allerede eksisterende kunnskap på området. Når vi da har en hypotese, konkluderer vi med en av to mulige hypoteser; nullhypotesen (H0) og den alternative hypotesen (H1).

18
Q

H0 og H1

A

Generelt kan vi si at H0 er den «konservative» hypotesen, altså den vi konkluderer med hvis dataene ikke representerer noe tydelig signal i noen retning.
H1 er den vi håper og prøver å vise. Det er altså nullhypotesen som faktisk blir testet statistisk, og svaret får vi i form av en p-verdi.

19
Q

Type I feil

A

Type I feil (falsk positiv) oppstår når vi på bakgrunn av en statistikk i utvalget beslutter at det er forskjell i populasjonen (vi ser at H1 er sann), uten at det er noen forskjell (H0 er sann). Vi forkaster altså feilaktig nullhypotesen, og tror feilaktig at vi har funnet en effekt. Dvs. at testen indikerer at vi har fått et signifikant resultat, mens resultatet egentlig framkom ved tilfeldigheter.

20
Q

Type II feil

A

Type II feil (falsk negativ) oppstår når vi på bakgrunn av en statistikk beslutter at det ikke er noen forskjell i populasjonen (beholder H0), når det faktisk er en forskjell (H1 er sann). Vi tror feilaktig at vi ikke har funnet en effekt, og aksepterer dermed nullhypotesen når den faktisk er feil.