Grunnleggende begreper Flashcards
Hva er en randomisert/tilfeldig variabel?
En matematisk størrelse som varierer i verdi. For eksempel kroppsvekt.
Hva er en uavhengig variabel (UV)? Hva kalles UV ofte i ANOVA?
Det er denne variabelen vi manipulerer i et eksperiment, og som påvirker den avhengige variabelen (AV).
I ANOVA-sammenheng er de uavhengige variablene ofte grupperingsvariabler som definerer hvilken gruppe en person/datapunkt i datasettet tilhører, for eksempel “mann/kvinne” eller “placebo/medisin”.
En uavhengig variabel kan kalles en faktor.
Hva er en avhengig variabel (AV)
Det er denne variabelen vi måler og er interessert i. I ANOVA så er man ute etter å se om det er en signifikant forskjell i den avhengige variabelen mellom gruppene. For eksempel reaksjonstid.
Hva er en kategorisk variabel?
Variabler som klassifiseres i gjensidige utelukkende kategorier. For eksempel kjønn, bosted, blodtype og fylke.
Hva er en kontinuerlig variabel?
En variabel som kan ha uendelig med verdier på en kontinuerlig skala. For eksempel høyde og reaksjonstid.
Hva er en faktor?
En faktor er en kategorisk, uavhengig variabel.
Hva er design?
Samling av uavhengige variabler (faktorer) og en avhengig variabel som definerer kjerneattributtene til en studie. Designet omfatter også utvalgsstørrelsen i hver gruppe og andre attributter ved studien som randomisering. Avhengig av hvor mange faktorer som studeres, snakker vi om «enfaktordesign», «tofaktordesign» osv.
Eksempel: «I en studie måler forskere år med utdanning (avhengig variabel) av mannlige og kvinnelige (faktor 1) Trump- vs. Clinton-velgere (faktor 2). Dette er en tofaktoriell 2 x 2-design.»
Design er altså den generelle utformingen forskningsprosjektet får, altså den strategien en forsker velger når forskningsprosjektet skal gjennomføres.
Hva er varians?
Varians er et estimat gjennomsnittlig avstand fra gjennomsnittet, og er derfor et spredningsmål. Ved å ta kvadratroten av variansen får man SD.
Hva er standardavvik (SD)?
Et estimat av gjennomsnittlig avstand fra gjennomsnittet i et sett med data målt i samme enhet som de originale dataene. Det er kvadratroten av varians.
Hva er varians og standardavvik? Hva representerer de?
Variansen og standardavvik sier noe om gjennomsnittlig avvik fra gjennomsnittet, men de gjør dette i ulike enheter.
Variansen er gjennomsnittlig avvik fra gjennomsnittet, men svaret er kvadrert.
Problemet med varians er at det representerer kvadratiske enheter (eksempel: kopp * kopp), og derfor er det nyttig å konvertere det til enheten for det opprinnelige målet, som vi gjør ved å regne ut standardavviket.
Hva er et utvalg?
Når vi måler en variabel, er vi vanligvis interessert i verdiene denne variabelen får i en populasjon av personer/tilfeller. For eksempel kan vi være interessert i “IQ for psykologistudenter”. I de fleste tilfeller er det umulig/urealistisk å måle alle emner/tilfeller i en populasjon, og derfor måles bare en undergruppe av disse. Denne delmengden kalles “utvalget”.
For å representere alle norske psykologistudenter for å finne gjennomsnittlig IQ, så kunne man brukt et utvalg som består av førsteårs psykologistudenter i Oslo og Tromsø.
Hva er en populasjon?
Alle personer/tilfeller som vår studie ønsker å generalisere til. Eksempel: «Vi målte reaksjonstiden til 40 psykologistudenter ved et norsk universitet og tar dette som et utvalg av alle psykologistudenter». Her er alle psykologistudenter populasjonen vi ønsker å generalisere til.
Hva er en hypotese? Hvilke to typer hypoteser skiller vi mellom? Hvilken type tillater ANOVA?
En teoretisk påstand om hvordan variabler avhenger av hverandre som lages før data samles inn.
Vi skiller mellom “retningsbestemte” hypoteser (f.eks.: skårene i gruppe 1 er større enn i gruppe 2) og “ikke-retningsbestemte” hypoteser (f.eks:skårene i gruppene er forskjellige). ANOVAer tillater bare undersøkelse av ikke-retningsbestemte hypoteser.
Eksempel: “Vi forventer at Trump-velgere og Clinton-velgere er forskjellige i hvor mange ord de kan produsere i en ordforrådstest.”
Hva er nullhypotesen?
Hypotesen om at grupper ikke er forskjellige med hensyn til den avhengige variabelen. Det er denne hypotesen vi tester.
I ANOVA-sammenheng er dette standardhypotesen som ANOVA prøver å falsifisere. Alle signifikanstester tar antagelsen om at det ikke er noen effekt og beregner sannsynligheten for å observere de observerte dataene (eller data som er mer ekstreme) gitt at nullhypotesen er sann.
Eksempel på en nullhypotese: “Utvekslingsstudenter og innfødte (norske) studenter er ikke forskjellige i hvor lang tid de bruker på å studere til en statistikkeksamen.”
Hva er en sannsynlighetsfordeling?
En fordeling av sannsynlighetene for at en variabel har ulike verdier.