Begreper Flashcards
Populasjon
Er om vi trekker et utvalg fra en stor gruppe som vi vil vite noe om, dvs. Generalisere til.
Hvilken sammenheng er det mellom feilmarginen (uttrykt gjennom konfidensintervall eller signifikansnivå) og antall observasjoner i et utvalg?
Jo flere observasjoner vi har i et sannsynlighetsutvalg, desto mindre blir feilmarginen.
Nominalnivå
Er om vi har samlet inn data som gjør at vi kan gruppere observasjonene våre, men ikke rangere de. (Eks kjønn og fødselsår)
Bivariat analyseteknik som anvendes på dette nivået er krysstabulering.
Forholdstallnivå
Er om vi har data hvor vi kan si noe om avstanden mellom observasjonene, og det også finnes et absolutt nullpunkt for dataene. (Eks lønn i kroner og alder i år)
Bivariat analyseteknik som anvendes på dette nivået er kovarians og korrelasjon
Hvilket målenivå bør variablene ha når du beregner korrelasjon mellom to variabler?
Minimum ordinalnivå, men helst intervallnivå- eller forholdhstallsnivå. (om man har data på ordinalnivå, bør man vurdere å bruke spearmans korrelasjon istedenfor pearson).
P-verdien eller signifikansnivået
Er verdien som sier noe om sannsynligheten for å ta feil hvis vi forkaster nullhypotesen
Type 1-feil
Er da vi feilaktig forkaster nullhypotesen
Type 2-feil
Er da vi beholder en usann nullhypotese
Faktoranalyse
Er en analyse vi kan gjøre for å redusere antall relaterte variabler til overordnede begreper (latente variabler) eller dimensjoner
Clusteranalyse
To typer:
Hierarkisk- Baseres på analyse av trestrukturer. Dendogram anvendes for å identifisere anbefalte Cluster, oppdeling skjer utifra likhet mellom datapunkter.
Ikke-hierarkisk- K-means clustering metoden. Forskeren bestemmer hvor mange cluster man ønsker å dele inn i sitt case. Oppdelingen skjer utifra likhet mellom datapunkter og maksimalt avstand mellom cluster.
En analyse vi kan bruke om vi vil segmentere eller gruppere enhetene/respondentene våre
“Sensitive data” eller “særlig kategori personopplysninger”
Nevnt i pensum: Helse, politisk oppfatning, religion, etnisitet, seksuell orientering, fagforeningstilhørighet, tidligere straffedommer.
Minste kvadraters metode. (MKM/OLS)
Er når vi prøver å minimere de kvadrerte avvikende mellom en lineær modell og de enkelte datapunktene i en regresjonsanalyse
Ordinalnivå
Kan rangeres på logisk sett, verdiene utrykker nivå, kvalitet eller stilling i en serie. (Eks Utdanningsnivå og hvor mye man liker is. (1-5) ).
Bivariat analyseteknik som anvendes på dette nivået er rangkorrelasjon
Intervallnivå
Kan klassifiseres og rangeres, samt spesifisere intervaller mellom verdiene. Har ingen naturlig nullpunkt (Eks temperatur og tidsberegning)
Bivariat Analyseteknik som anvendes på dette nivået er Kovarians og korrelasjon
Krysstabulering
Anvendes når vi studerer sammenheng av to variabler som er på nominalnivå
Målet er å kunne spore sammenhengen og mønster.
Med krysstabulering undersøker vi:
- Hvordan observasjoner fordeler seg på kombinasjoner av verdier på to variabler.
- En fordeling av antall observasjoner
- En prosentfordeling av observasjoner