1 - Introduksjon Flashcards
Hva er hovedmålet til statistikk generelt?
Hovedmålet til statistikk er å forstå den komplekse virkeligheten gjennom enkle begreper som fanger de essensielle aspektene.
Hva er statistikks hovedelementer?
Hovedelementene i statistikk er å beskrive, ta avgjørelser, predikere og rapportere.
- Beskrive verden på en forenklet måte, uten å miste relevant informasjon
- Beslutte ting basert på data i møte med usikkerhet
- Forutsi fremtidige hendelser ved å bruke kunnskap fra tidligere situasjoner.
- Vi rapporterer resultatene.
Hva er deskriptiv statistikk?
Deskriptiv statistikk har som mål å beskrive mønster i data, som betyr at den oppsummerer og beskriver de viktigste egenskapene til et datasett.
Bruker variabler.
Oppsummerer data med spesielle mål, for eksempel gjennomsnitt.
Lager grafer for å visualisere data.
Hva er slutningsstatistikk?
Inferensiell statistikk/slutingsstatistikk har som mål å forklare/predikere fenomener.
- Tester hypoteser med statistiske modeller.
- Trekker konklusjoner om “generelle prinsipper” i populasjonen, basert på utvalg.
- Lager prediksjoner for fremtidige hendelser.
Hva er forskjellen på data og variabler?
Data er det vi samler inn, mens variabler er det vi måler og som kan variere. En variabel må ha minimum to ulike verdier i et datasett for å ikke være en konstant.
Hvordan henger validitet og reliabilitet sammen med konsepter og variabler?
Variabler bør på en adekvat måte fange konseptet som studeres, både med høy reliabilitet og høy validitet.
Når vi snakker om validitet med tanke på et konspet eller en varaibel, handler det om at varaibelen er opersjonalisert slik at vi måler det som skal måles.
Relibilitet handler om at når vi skal måle en variabel skal denne målingen være konsistent.
Hvordan kan variabler bli klassifisert basert på hvordan de representerer data?
Vi kan klassifisere en variabel i om den er numerisk eller kategorisk.
Numerisk er kvantitative variabler, altså tall, mens kategorisk er kvalitative variabler.
Numeriske variabler er verdier som representerer forskjellige størrelser med like intervaller mellom. Kategoriske variabler representerer ulike kategorier.
Hvordan deler vi inn numeriske variabler?
Vi deler numeriske variabler inn i to typer: kontinuerlige og diskrete.
Kontinuerlige variabler er variabler som kan ha hvilken som helst verdi innenfor et område. De kan ha uendelig med desimaler. Eksempel er høyde i cm.
Diskrete variabler er hele verdier, altså de kan ikke ha desimaler. Eksempel kan være antall søsken i en familie.
Hvordan deler vi inn kategoriske variabler?
Kategoriske variabler kan deles inn binære/dikotome variabler, nominale variabler og ordinale variabler.
Binære eller dikotome variabler har kun gjensidig ekskluderende kategorier. Et eksempel på dette kan være “JA og NEI” eller “sant og usant”.
- Nominale variabler er variabler som har to eller flere kategorier som ikke er rangert. Eksempler er “norsk, spansk og engelsk”.
- Ordinale variabler er verdier som kan rangeres basert på styrke. Eksempel på dette kan være “ingen - lite - medium - mye” eller antall stjerner til en film. Det er en rangering, men det er ikke like intervaller mellom verdiene.
Hvordan kan variabler bli klassifisert basert på deres målenivå (nivå av informasjon)?
(Bare nevne de ulike)
Vi har fire ulike målenivåer. Vi har nominal-skala, ordinal-skala, intervall-skala og ratio-skala.
Hva er nominal-skala?
Nominal-skala er det mest grunnleggende målenivået. Variabelen kan klassifiseres i gjensidige utelukkende kategorier. Her differensierer vi. Eksempel kan være bosted, blodtype, politisk parti og fylke.
Hva er ordinal-skala?
Ordinal-skala har egenskapen med at variabler kan organiseres ut ifra kategorier, og kategoriene kan rangeres, men det er ikke lik avstand mellom kategoriene. Eksempel kan være likert-skala, “uenig- litt uenig-nøytral- litt enig-enig” eller stadier av kreft.
Hva er intervall-skala?
Intervall-skala har egenskapen ved at det er like intervaller mellom verdiene, i tillegg til at de kan kategoriseres og rangeres.
Hva er ratio-skala?
Ratio-skala er det samme som intervall-skala, men de har også et absolutt nullpunkt. Eksempel kan være høydemål eller inntekt målt i kroner.
Hvordan kan variabler bli klassifisert basert på deres rolle i statistisk analyse? Gi et eksempel.
Vi klassifiserer en variabel i om den er avhengig eller uavhengig.
Avhengig variabel:
Vi endrer den aldri, men vi måler den. Den er avhengig av en annen variabel. Endring i den avhengige variabelen er avhengig av endring i den uavhengige variabelen
Uavhengig variabel:
Den variabelen vi manipulerer
Et eksempel på disse er i studier av om en ny pille forårsaker søvnighet. Søvnighet er den avhengige variabelen, mens hvorvidt man får pillen eller ikke er den uavhengige variabelen.