Grunnleggende (fra Anki) Flashcards

1
Q

(?) har verdier som er gjensidige utelukkende (eks. blodtype, politisk parti, egennavn, fylke) og som ikke kan direkte måles opp mot hverandre.

A

Nominale variabler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

[…] er verdien som opptrer oftest.

A

Modus (typetall) er verdien som opptrer oftest.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Varians skrives som […]

A

Varians skrives som S^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Variansen beskriver […]. Hvordan kan vi gjøre varians (S^2) om til standardavvik?

A

Variansen beskriver hvor langt verdiene avviker fra sentraltendensen.
Vi kan gjøre varians om til standardavvik ved å ta kvadratroten av variansen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Spredning kan måles med […] og […].

A

Spredning kan måles med standardavvik og varians.
Spredningsmål er et mål for spredningen av observasjonene i et datamateriale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ratio nivået for måling brukes for numeriske data som har et meningsfull nullpunkt, […] og en […]. (f.eks. vekt i kilogram, tid i sekunder, temperatur i Kelvin)

A

Ratio nivået for måling brukes for numeriske data som har en meningsfull nullpunkt, like enheter for måling og en sann (absolutt) nullverdi. (f.eks. vekt i kilogram, tid i sekunder, temperatur i Kelvin)

Rationivået for måling brukes for numeriske data og har like intervaller mellom verdiene, og et absolutt nullpunkt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Plagiat er å […]

A

Plagiat er å fremstille andre sitt arbeid som om det var ens eget

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Medianen er verdien […].

A

Medianen er verdien i midten.

Oddetall:
1-1-2-3-5-6-7-8-9

Partall - (gjennomsnittet av de to midterste, her 6.5):
1-1-2-3-(6-7)-7-8-9-10

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

[…] bruker sannsynlighetsteori for å lage prediksjoner og trekke konklusjoner, mens […] ikke involverer sannsynlighetsteori.

A

Inferensiell statistikk bruker sannsynlighetsteori for å lage prediksjoner og trekke konklusjoner, mens deskriptiv statistikk ikke involverer sannsynlighetsteori.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er forholdet mellom statistikk og parametere?

A

Vi beregner statistikk fra vårt utvalg for å estimere populasjonens parametere.

Så et parameter er en fast egenskap ved en populasjon, mens en statistikk er en verdi som oppsummerer data fra et utvalg.

Eksempler:
Parameter: Gjennomsnittlig høyde på alle voksne menn i Norge.
Statistikk: Gjennomsnittlig høyde på voksne menn i et utvalg vi gjør fra Oslo.

Parameter: Variansen i høyde blant alle kvinnelige universitetsstudenter i Trondheim.
Statistikk: Variansen i høyde blant kvinnelige universitetsstudenter i en tilfeldig utvalgt klasse i Trondheim.

Parameter: Gjennomsnittlig årslønn for alle lærere i Norge.
Statistikk: Gjennomsnittlig årslønn for lærere i et utvalg fra Stavanger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva er n? Hvorfor deler vi avvikskvadratene med n-1, og ikke bare n?

A

Ved å dele avvikskvadratene med n-1 (frihetsgrader) (i stedet for bare n), får vi et mer konservativt estimat av variansen i populasjonen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Variabler kan ha følgende tre karaktertrekk:

A

*Kategorisk (øyefarge: blå, brun, grønn)

Numeriske:
*Diskrete (antall bøker i en bokhylle: 1, 2, 3, …)
*Kontinuerlig (kroppstemperatur: 36.2°C, 36.3°C, 36.4°C, …)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Utvalget er en […] […].

A

Utvalget er en (forhåpentligvis representativ) mindre samling av tilfeller trukket fra en populasjon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Statistikk oppsummert med fire ord: […]!

A

Statistikk oppsummert med fire ord: inferens fra uperfekte data!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Skjevhet (skewness) refererer til at […] er forlenget ut mot høyre eller venstre.

A

Skjevhet (skewness) refererer til at halen er forlenget ut mot høyre eller venstre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Sirklene i enden av værhårene (whiskers) på dette boksplottet indikerer […].

A

Sirklene i enden av værhårene (whiskers) på dette boksplottet indikerer uteliggere / ekstremverdier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Sentraltendens måles ved hjelp av gjennomsnittet, medianen eller modusen. Disse representerer den […] for en variabel.

A

Sentraltendens måles ved hjelp av gjennomsnittet, medianen eller modusen. Disse representerer den “typiske” verdien for en variabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Sentralgrenseteoremet (central limit theorem) sier at når utvalgsstørrelsen […], er brudd på normalfordeling typisk sett ikke et stort problem.

A

Sentralgrenseteoremet (central limit theorem) sier at når utvalgsstørrelsen øker (100+ observasjoner), er brudd på normalfordeling typisk sett ikke et stort problem.

PS: Forskjellige kilder bruker ulike tall, men utvalg mindre enn 30 bør nesten alltid analyseres nøye og krever vanligvis ikke-parametriske metoder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Representativte utvalg bør være:

  • T[…]
  • U[…] (eks. alle bør ikke være dine venner)
  • I[…]
A
  • Tilfeldig samlet
  • Uavhengig (tilfellene er ikke relatert til hverandre) (eks. alle bør ikke være dine venner)
  • Idéntisk fordelt (ideelt sett: utvalg med tilbakelegging)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Når det gjelder skjevhet, refererer vi til toppen eller halen som skjev mot høyre/venstre?

A

Halen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Hvorfor er normalfordelinger så viktig i statistikk?

A

Fordi dersom utvalget er normalfordelt er det mer sannsynlig at det kommer fra en normalfordelt populasjon.
Det betyr at våre statistiske estimater og konklusjoner trolig er mer presise, som vil si at man kan trekke en konklusjon om populasjonen basert på utvalget.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Hva er HARKing?

A

Hypothesizing after the results are known (IKKE GJØR DET!)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Positiv skjevhet betyr at halen er skjev mot […].

A

Positiv skjevhet betyr at halen er skjev mot høyre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Populasjonen er […].

A

Populasjonen er samlingen av tilfeller vi ønsker å generalisere til.

Eks:
- Vi samler data fra en gruppe studenter på UiT, men vi prøver egentlig å trekke konklusjoner om studenter mer generelt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Perfekte gaussiske fordelinger har […] skjevhet (skewness) og kurtose (kurtosis). Og hvordan er gjennomsnitt, median og modus fordelt?

A

Perfekte gaussiske fordelinger har null skjevhet (skewness) og kurtose (kurtosis).

Gjennomsnitt, median og modus er også det samme i en perfekt normalfordeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Parametriske tester forutsetter at dataene følger en […].

A

Parametriske tester forutsetter at dataene følger en normalfordeling.

27
Q

P-hacking og HARKing er eksempler på forskningspraksiser som kan føre til […] og øke sannsynligheten for […].

A

P-hacking og HARKing er eksempler på forskningspraksiser som kan føre til falske positive resultater og øke sannsynligheten for publikasjonsbias.

28
Q

Ofte (men ikke alltid), brukes:
Greske bokstaver for […]
og romerske bokstaver for […].

A

Ofte (men ikke alltid), brukes:
Greske bokstaver for parametere
og romerske bokstaver for statistikker.

29
Q

Notasjoner for standardavviket:
Forkortelse: […]
I utvalget: […]
I populasjonen: […]

A

Forkortelse: SD
I utvalget: s
I populasjonen: σ (sigma)

30
Q

Notasjoner for gjennomsnittet:
I utvalget: […]
I populasjonen: […].

A

I utvalget: x̄ (x-bar)
I populasjonen: μ (mu).

31
Q

Noen måter å vurdere normalitet på:
Grafisk:
[…]
Numerisk:
[…]

A

Grafisk:
* Histogram
* Boksplott
* P–P-plott
* Q–Q-plott

Numerisk:
* Shapiro–Wilk-test
* Standardavvik / Gjennomsnitt
* Kolmogorov–Smirnov-test
* Skjevhet
* Kurtosis

32
Q

Nivået av intervall-måling brukes for numeriske data som har en meningsfull nullverdi og […] (for eksempel temperatur i Celsius, relativ risiko, avkastning på investering osv.).

A

Nivået av intervall-måling brukes for numeriske data som har en meningsfull nullverdi og like måleenheter (for eksempel temperatur i Celsius, relativ risiko, avkastning på investering osv.).

33
Q

Målet med […] er å avgjøre om de observerte dataene gir tilstrekkelig bevis for å forkaste nullhypotesen.

A

Målet med nullhypotesetesting (NHST) er å avgjøre om de observerte dataene gir tilstrekkelig bevis for å forkaste nullhypotesen

34
Q

Med Ratio (skalanivå) kan du:

A

Du kan regne forholdet mellom nivåene. Eks. penger tjent.

Fordi celsius krysser 0-grensen så kan man egentlig ikke kalle 10grader halvparten av 20 grader.
Penger krysser ikke null-grensen, og derfor kan vi si at 10 kroner er halvparten av 20kr. (her blander vi ikke inn gjeld)

35
Q

Kvantiler er […].

A

Kvantiler er verdier i en datasett som deler datasettet i like store deler.

36
Q

Kurtose er en måling som forteller oss noe om […].

A

Kurtose er en måling som forteller oss noe om hvordan verdiene er fordelt i forhold til gjennomsnittet.

Tommelfingerreglene for hva som er “akseptabelt” varierer.
Tommelfingerregel (fra Gabors pp) sier at kurtose over eller under -2 indikerer et problem.
En mer presis estimering: del kurtoseskåren med dens standradfeil (SE) (det gir oss en z-skår). I dette tilfellet er kurtose problematisk hvis z-skåren er enten over 1.96 eller under -1.96.

37
Q

I statistikk betyr inferens å […] for å […].

A

I statistikk betyr inferens å bruke data for å trekke generelle konklusjoner om en populasjon.

38
Q

I mange publikasjoner er deltakerne dessverre WEIRD.
Dette er et problem fordi […]. Hva står WEIRD for?

A

Dette er et problem fordi de ikke alltid er representative for “mennesker.

  • Western
  • Educated
  • Industrialized
  • Rich
  • Democratic
39
Q

I forskningsdesign er variabler enten […]

A

Avhengige eller uavhengige

40
Q

I et utvalg måler du […] og prøver å estimere […] (altså de sanne verdiene i populasjonen).

A

I et utvalg måler du statistikker og prøver å estimere parametere (altså de sanne verdiene i populasjonen).

41
Q

I en […] har den alternative hypotesen (H1) en retning, for eksempel “gjennomsnittet er større enn X” eller “gjennomsnittet er mindre enn X”.

A

I en en-halet test har den alternative hypotesen (H1) en retning, for eksempel “gjennomsnittet er større enn X” eller “gjennomsnittet er mindre enn X”.

“Klimakrisen kommer til å gjøre norske somre varmere” = én retning, en-hale.

“Klimakrisen kommer til å endre norske sommertemperaturer til enten varmere eller kaldere” = To retninger, to haler.

42
Q

I en parametrisk test bør utvalgsstørrelsen være minst […] for at resultatene skal være pålitelige.

A

I en parametrisk test bør utvalgsstørrelsen være minst 30 for at resultatene skal være pålitelige.

43
Q

Høy statistisk styrke reduserer sannsynligheten for å gjøre en […].

A

Høy statistisk styrke reduserer sannsynligheten for å gjøre en type II-feil (som betyr å feilaktig si at det ikke var noen effekt).

44
Q

Hvis Shapiro-Wilk-testen er signifikant (p < .05), indikerer det at dataene […].

A

Hvis Shapiro-Wilk-testen er signifikant (p < .05), indikerer det at dataene avviker signifikant fra normalfordelingen.

45
Q

Hva er uavhengig variabel?

A

Den variablen du manipulerer/endrer

46
Q

Hva er avhengig variabel?

A

Det som måles i et eksperiment. Variabelen som påvirkes av uavhengig variabel.

47
Q

For å vurdere hvor representativ utvalget vårt er, kan vi sjekke hvor […] på ulike mål.
F.eks: Vi kan sammenligne […] med populasjonen, dersom det finnes data på dette.

A

For å vurdere hvor representativ utvalget vårt er, kan vi sjekke hvor likt utvalget er populasjonen på ulike mål.

F.eks: Vi kan sammenligne alder, kjønn, sosioøkonomisk status, yrke, utdanning, helse, personlighet, osv. med populasjonen, dersom det finnes data på dette.

48
Q

Et ordinalt målenivå tilordner verdier i en […], som […], men det er ikke […] (for eksempel […]).

A

Et ordinalt målenivå tilordner verdier i en spesifikk rekkefølge, som rangeringer eller vurderinger, men det er ikke lik avstand (for eksempel liten, middels, stor, kort-lang, stadier av kreft).

49
Q

Et nominelt målenivå tilordner verdier til en variabel som […] (for eksempel […], osv.).

A

Et nominelt målenivå tilordner verdier til en variabel som identifiserer kategorier (for eksempel kjønn, rase, øyenfarge, blodtype, politisk parti, osv.).

50
Q

En […] brukes når forskningshypotesen ikke spesifiserer retningen på den forventede effekten.

A

En to-halet test brukes når forskningshypotesen ikke spesifiserer retningen på den forventede effekten.

“Klimakrisen kommer til å gjøre norske somre varmere” = én retning, en-hale.

“Klimakrisen kommer til å endre norske sommertemperaturer til enten varmere eller kaldere” = To retninger, to haler.

51
Q

En perfekt normalfordeling kalles også […] eller en […].

A

En perfekt normalfordeling kalles også gaussisk fordeling eller en bell-curve.

52
Q

En ikke-parametrisk test forutsetter […] av dataene.

A

En ikke-parametrisk test forutsetter ikke normalfordeling av dataene.

53
Q

Det mest praktiske en forsker kan gjøre for å øke statistisk styrke er å […].

A

Det mest praktiske en forsker kan gjøre for å øke statistisk styrke er å øke utvalgsstørrelsen (altså samle flere deltakere).

54
Q

Deskriptiv statistikk oppsummerer og beskriver de viktigste egenskapene til et datasett, mens […] bruker utvalgsdata til å trekke slutninger om populasjonen.

A

Deskriptiv statistikk oppsummerer og beskriver de viktigste egenskapene til et datasett, mens inferensiell statistikk bruker utvalgsdata til å trekke slutninger om populasjonen.

55
Q

Den avhengige variabelen kalles og […].

A

Utfallsvariabelen

56
Q

Delta betyr […], og symboliseres med den greske store bokstaven […]. F.eks. kan en forskningsartikkel skrive “gjennomsnittlig forskjellsskår” som […].

A

Delta betyr endringen i en verdi, og symboliseres med den greske store bokstaven Δ.

F.eks. kan en forskningsartikkel skrive “gjennomsnittlig forskjellsskår” som ΔM.

For eksempel, hvis den laveste temperaturen på en bestemt dag var 12 grader og den høyeste temperaturen var 22 grader, vil dette gi en delta på 10 grader.

57
Q

Hovedmålene med statistikk er:

A
  • Beskrive verden på en forenklet måte (uten å miste relevant informasjon)
  • Beslutte ting basert på data i møte med usikkerhet
  • Forutsi fremtidige hendelser ved å bruke kunnskap fra tidligere situasjoner
  • Rapportere resultater
58
Q

De to egenskapene til en normalfordeling er:

A
  • Gjennomsnitt: x̄ (x-strek) eller μ (mu)
  • Standardavvik: s eller σ (sigma)
59
Q

De fire vanligvis beskrevne nivåene for målinger er […]. Hvor mange bruker programmer som JASP og SPSS?

A

De fire vanligvis beskrevne nivåene for målinger er nominal, ordinal, interval og ratio.

Programmer som JASP og SPSS bruker tre:
Skala (interval og ratio)
Ordinal (f.eks. lav - middels - høy rangering)
Nominal (f.eks. kjønn, politisk parti, blodtype, øyenfarge)

60
Q

De fire målenivåene er:

A

Nominal, ordinal, intervall og ratio

61
Q

Dette er et eksempel på et: (type fremstilling)

A

Histogram

62
Q

Dette er et eksempel på et: (type fremstilling)

A

Boxplot

63
Q

Dette er et eksempel på et: (type fremstilling)

A

Stolpediagram/barchart

64
Q

“Cherrypicking” betyr […].

A

“Cherrypicking” betyr å selektere ut kun de data som støtter ditt argument.