Grunnleggende begreper Flashcards

1
Q

Hva er en randomisert/tilfeldig variabel?

A

En matematisk størrelse som varierer i verdi. For eksempel kroppsvekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er en uavhengig variabel (UV)? Hva kalles UV ofte i ANOVA?

A

Det er denne variabelen vi manipulerer i et eksperiment, og som påvirker den avhengige variabelen (AV).

I ANOVA-sammenheng er de uavhengige variablene ofte grupperingsvariabler som definerer hvilken gruppe en person/datapunkt i datasettet tilhører, for eksempel “mann/kvinne” eller “placebo/medisin”.
En uavhengig variabel kan kalles en faktor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er en avhengig variabel (AV)

A

Det er denne variabelen vi måler og er interessert i. I ANOVA så er man ute etter å se om det er en signifikant forskjell i den avhengige variabelen mellom gruppene. For eksempel reaksjonstid.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hva er en kategorisk variabel?

A

Variabler som klassifiseres i gjensidige utelukkende kategorier. For eksempel kjønn, bosted, blodtype og fylke.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er en kontinuerlig variabel?

A

En variabel som kan ha uendelig med verdier på en kontinuerlig skala. For eksempel høyde og reaksjonstid.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er en faktor?

A

En faktor er en kategorisk, uavhengig variabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva er design?

A

Samling av uavhengige variabler (faktorer) og en avhengig variabel som definerer kjerneattributtene til en studie. Designet omfatter også utvalgsstørrelsen i hver gruppe og andre attributter ved studien som randomisering. Avhengig av hvor mange faktorer som studeres, snakker vi om «enfaktordesign», «tofaktordesign» osv.

Eksempel: «I en studie måler forskere år med utdanning (avhengig variabel) av mannlige og kvinnelige (faktor 1) Trump- vs. Clinton-velgere (faktor 2). Dette er en tofaktoriell 2 x 2-design.»

Design er altså den generelle utformingen forskningsprosjektet får, altså den strategien en forsker velger når forskningsprosjektet skal gjennomføres.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er varians?

A

Varians er et estimat gjennomsnittlig avstand fra gjennomsnittet, og er derfor et spredningsmål. Ved å ta kvadratroten av variansen får man SD.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er standardavvik (SD)?

A

Et estimat av gjennomsnittlig avstand fra gjennomsnittet i et sett med data målt i samme enhet som de originale dataene. Det er kvadratroten av varians.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er varians og standardavvik? Hva representerer de?

A

Variansen og standardavvik sier noe om gjennomsnittlig avvik fra gjennomsnittet, men de gjør dette i ulike enheter.

Variansen er gjennomsnittlig avvik fra gjennomsnittet, men svaret er kvadrert.

Problemet med varians er at det representerer kvadratiske enheter (eksempel: kopp * kopp), og derfor er det nyttig å konvertere det til enheten for det opprinnelige målet, som vi gjør ved å regne ut standardavviket.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva er et utvalg?

A

Når vi måler en variabel, er vi vanligvis interessert i verdiene denne variabelen får i en populasjon av personer/tilfeller. For eksempel kan vi være interessert i “IQ for psykologistudenter”. I de fleste tilfeller er det umulig/urealistisk å måle alle emner/tilfeller i en populasjon, og derfor måles bare en undergruppe av disse. Denne delmengden kalles “utvalget”.

For å representere alle norske psykologistudenter for å finne gjennomsnittlig IQ, så kunne man brukt et utvalg som består av førsteårs psykologistudenter i Oslo og Tromsø.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva er en populasjon?

A

Alle personer/tilfeller som vår studie ønsker å generalisere til. Eksempel: «Vi målte reaksjonstiden til 40 psykologistudenter ved et norsk universitet og tar dette som et utvalg av alle psykologistudenter». Her er alle psykologistudenter populasjonen vi ønsker å generalisere til.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva er en hypotese? Hvilke to typer hypoteser skiller vi mellom? Hvilken type tillater ANOVA?

A

En teoretisk påstand om hvordan variabler avhenger av hverandre som lages før data samles inn.

Vi skiller mellom “retningsbestemte” hypoteser (f.eks.: skårene i gruppe 1 er større enn i gruppe 2) og “ikke-retningsbestemte” hypoteser (f.eks:skårene i gruppene er forskjellige). ANOVAer tillater bare undersøkelse av ikke-retningsbestemte hypoteser.

Eksempel: “Vi forventer at Trump-velgere og Clinton-velgere er forskjellige i hvor mange ord de kan produsere i en ordforrådstest.”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva er nullhypotesen?

A

Hypotesen om at grupper ikke er forskjellige med hensyn til den avhengige variabelen. Det er denne hypotesen vi tester.

I ANOVA-sammenheng er dette standardhypotesen som ANOVA prøver å falsifisere. Alle signifikanstester tar antagelsen om at det ikke er noen effekt og beregner sannsynligheten for å observere de observerte dataene (eller data som er mer ekstreme) gitt at nullhypotesen er sann.

Eksempel på en nullhypotese: “Utvekslingsstudenter og innfødte (norske) studenter er ikke forskjellige i hvor lang tid de bruker på å studere til en statistikkeksamen.”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva er en sannsynlighetsfordeling?

A

En fordeling av sannsynlighetene for at en variabel har ulike verdier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hva er statistisk test?

A

Enhver prosedyre som beregner en test-statistikk (et sammendrag av dataene) og sammenligner det med den hypotetiske fordelingen av verdier for den statistikken som ville vært forventet hvis det ikke var noen effekt (nullhypotesen).

ANOVA er en statistisk test.

17
Q

Hva er en lineær modell?

A

En matematisk modell som beskriver en lineær sammenheng mellom ulike størrelser.

En lineær modell kan skrives som:
Y = a + BX + E

Y er den avhengig variabelen,

X er den uavhengig variabelen,

E er feilvariabelen,

a er interseptet, dvs. verdien til Y når X = 0.

B er stigningslinja, den sier hvor mye Y endres når X økes med 1 enhet.

18
Q

Hva er prediksjonsfeil/residual?

A

Forskjellen mellom verdien en modell predikerer og verdien observert i data som modellen er basert på. Enkelt sagt et avvik. Det antas vanligvis at denne feilen er tilfeldig.

19
Q

Hva er sum-of-Squares (SS)?

A

Et estimat på spredning på et sett av observasjoner rundt et parameter, for eksempel gjennomsnitt.

Først finner man avviket for hver skår, og så kvadrerer man denne verdien.

SS er summen av disse kvadrerte avvikene.

20
Q

Hva er Sum of squares errors (SSE) ?

A

Denne verdien (SSE) summerer alle feil i en lineær modell (regresjon eller ANOVA) ved å legge sammen de kvadrerte forskjellene mellom de faktiske og predikerte verdiene for hver observasjon.

Før man kan beregne disse forskjellene, må man lage en predikert verdi for hver observasjon, enten ved hjelp av regresjonsmodellen eller gruppegjennomsnitt (i ANOVA).

SSE viser hvor mye varians i den avhengige variabelen (Y) som ikke forklares av modellen, altså hvor mye modellens prediksjoner avviker fra de faktiske observasjonene.

21
Q

Hva er Model Sum of Squares (SSm)?

A

SSM måler forklart varians, altså hvor mye modellen forklarer av variansen i dataene sammenlignet med gjennomsnittet av de observerte verdiene.

Man regner SSm ved å kvadrere og summere forskjellene mellom verdiene predikert av modellen og grand mean (ANOVA) eller gjennomsnittet av Y (regresjon).

Jo større verdien er, desto mer varians forklarer modellen i den avhengige variabelen.

I regresjon betyr det at den lineære modellen har forbedret seg til å predikere den avhengige variabelen sammenlignet med gjennomsnittet av Y.

22
Q

Sum of squares total (SST)

A

Denne verdien uttrykker den totale mengden varians i den avhengige variabelen (Y). Den summerer alle forskjeller mellom gjennomsnittet og hver observert verdi i datasettet ved å summere deres kvadrerte forskjeller.

Dette blir det sammen som summen av SSM og SSE.
SST = SSm + SSE